Open Data Gouv : Dotation d’action parlementaire (Sénat), mon deuxième test.

Après avoir pris ce fichier : Réserve parlementaire 
Capture d’écran 2016-01-15 à 16.39.15

Maintenant je prends ce fichier : Dotation d’action parlementaire (Sénat)

Capture d’écran 2016-01-15 à 16.37.44

On commence par le fichier CSV, qui est au bon format ! Contrairement au fichier du Parlement on a des points-virgules et non des virgules. Mais je ne suis pas pour autant un adepte de ce format à cause des retours chariots.

$ cat reserve2014.csv | awk -F ";" '{print NF-1 }' | sort -n | uniq -c
     84 0
      7 2
     51 3
     51 6
      7 7
   6105 9

Il y a quand même 84+7+51+51+7 = 200 lignes à reprendre. Mais il y a des solutions pour reprendre ceci de façon automatique … awk …

Le fichier JSON est vraiment mal fait, contrairement au fichier du Parlement, toutes les données sont sur une même ligne !

$ wc -l reserve2014.json
0 reserve2014.json

Il y a vraiment un problème de format …. je vais donc essayer de lancer une discussion afin d’améliorer la qualité des fichiers. Ma précédente discussion a été refusée sûrement parce que j’avais mis un lien (URL), cette fois je vais mettre que du texte.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Time limit is exhausted. Please reload CAPTCHA.