Open Data Gouv : Tentative de discussion

Suite aux nombreux problèmes sur les fichiers, je vais donc essayer de lancer des discussions sur leur site. Pour que cela fonctionne je vais parler d’un seul problème à la dois et je vais aussi ne pas mettre d’email ou d’URL dans le contenu.

Discussion n°1 : Format du fichier JSON

Bonjour,
Le fichier JSON est difficile à exploiter, car toutes les données sont mises sur une seule ligne. Pouvez-vous faire en sorte que cela soit comme le fichier JSON de la réserve parlementaire ?
Cordialement.

Capture d’écran 2016-01-16 à 15.24.45

Discussion n°2 : Format du fichier JSON

Bonjour,
Pouvez-vous mettre le même délimiteur pour les deux fichiers JSON (2013/2014) ? Dans un fichier c’est ‘ (2013) et dans l’autre c’est  » (2014).
Cordialement.

Discussion n°3 : Format des fichiers CSV

Bonjour,
Pourquoi avoir choisit la virgule et non le point-virgule comme délimiteur ? On a déjà fort à faire à cause des retours chariots. Si on prend une phase telle que : « Evolution du site (interfaçage interactive), création de podcasts audio, évènements thématiques » on se retourne avec plein de virgule … le fichier CSV du sénat sur les réserves parlementaires utilise un point-virgule, ce qui est très bien. Il faut toujours prendre le caractère le moins utilisé.
Cordialement.

Discussion n°4 : C’est trop NULL

Bonjour,
Un moment on a trop de champ NULL pour que cela soit exploité :
{
‘Bénéficiaire’ : ‘Club des plus belles baies du monde’,
‘Adresse’ :  »,
‘Descriptif’ : ‘Fonctionnement’,
‘Montant’ : 3000.00,
‘Nom’ : ‘Groupe UMP’,
‘Prénom’ : NULL,
‘Département’ : ‘*(non rattaché à un département)’,
‘Groupe’ : NULL,
‘Programme budgétaire’ : ‘113-01’,
‘ID_Acteur’ : NULL
},
C’est normal ?

Discussion n°5 : Groupe dans le nom.

Bonjour,
Pourquoi avoir choisit de mettre le Groupe dans le nom alors qu’il y a un champ groupe. L’idéal aurait été de mettre le champ nom vide. Par exemple :
{
‘Bénéficiaire’ : ‘A.A.S.C.O.’,
‘Adresse’ : ‘107 avenue Gabriel Péri – 93400 Saint-Ouen’,
‘Descriptif’ : ‘Fonctionnement’,
‘Montant’ : 10000.00,
‘Nom’ : ‘Groupe SRC’,
‘Prénom’ :  »,
‘Département’ : ‘*(non rattaché à un département)’,
‘Groupe’ :  »,
‘Programme budgétaire’ :  »,
‘ID_Acteur’ : NULL
},
Cordialement.

Discussion n°6 : Par moment dans le champ nom on a le nom et le prénom

Bonjour,
Par moment dans le champ nom on a le nom et le prénom, ou alors que le nom pour une même personne. Par exemple : {
‘Bénéficiaire’ : ‘Commune de MECRIN ‘,
‘Adresse’ :  »,
‘Descriptif’ : ‘Aménagement de la place du général de Gaulle’,
‘Montant’ : 10000.00,
‘Nom’ : ‘PANCHER Bertrand’,
‘Prénom’ :  »,
‘Département’ : ‘Meuse’,
‘Groupe’ : ‘UDI’,
‘Programme budgétaire’ : ‘122-01’,
‘ID_Acteur’ : ‘PA333421’
},
Dans le même ordre d’idée, par moment le nom n’est pas écrit de la même façon. Par exemple : DE MAZIERES et DE MAZIèRE.
L’idéal serait donc de s’appuyer sur le ID_ACTEUR et d’avoir donc un autre fichier JSON avec les noms et prénom des ID_ACTEUR. Cela permettrait aussi de supprimer les champs Nom et Prénom … Qu’en pensez vous ?
Cordialement.

On ne pourra pas dire que j’ai pas voulu discuter :

Capture d’écran 2016-01-16 à 18.02.45

Maintenant il ne reste qu’a contacter le créateur de se magnifique site, pour lui dire que la création de compte avec Twitter , Google, Linkedin ne fonctionne pas. Et aussi lui dire que la session qui dure plus de 3 heures alors qu’il y a aucune activité, ce n’est pas l’idéal en terme de sécurité. L’autre chose qui serait bien cela serait de pouvoir mettre une URL afin que les personnes puissent se présenter et se connaître … dans ce site il n’y a que des « concombres masqués ».

Mes deux précédents POST :

Open Data Gouv : Dotation d’action parlementaire (Sénat), mon deuxième test.

Après avoir pris ce fichier : Réserve parlementaire 
Capture d’écran 2016-01-15 à 16.39.15

Maintenant je prends ce fichier : Dotation d’action parlementaire (Sénat)

Capture d’écran 2016-01-15 à 16.37.44

On commence par le fichier CSV, qui est au bon format ! Contrairement au fichier du Parlement on a des points-virgules et non des virgules. Mais je ne suis pas pour autant un adepte de ce format à cause des retours chariots.

$ cat reserve2014.csv | awk -F ";" '{print NF-1 }' | sort -n | uniq -c
     84 0
      7 2
     51 3
     51 6
      7 7
   6105 9

Il y a quand même 84+7+51+51+7 = 200 lignes à reprendre. Mais il y a des solutions pour reprendre ceci de façon automatique … awk …

Le fichier JSON est vraiment mal fait, contrairement au fichier du Parlement, toutes les données sont sur une même ligne !

$ wc -l reserve2014.json
0 reserve2014.json

Il y a vraiment un problème de format …. je vais donc essayer de lancer une discussion afin d’améliorer la qualité des fichiers. Ma précédente discussion a été refusée sûrement parce que j’avais mis un lien (URL), cette fois je vais mettre que du texte.