Skip to content

Instantly share code, notes, and snippets.

@davidbgk davidbgk/stats.md
Created Jun 22, 2017

Embed
What would you like to do?
Statistiques autour des données datagouv compilées pendant la Workweek

Stats Datagouv

Au 2017-06-20, il y a 65535 resources et 24699 datasets.

Il y a 52618 ressources de type file, 17642 de type remote et 409 de type api.

Il y a 37847 ressources inspire + geo-ide récupérées via la passerelle Inspire sur les 65535 resources disponibles (soit 58%) qui sont indiquées comme étant de type file alors qu’elles sont remote.

Il y a donc 14771 ressources locales de type file auxquelles il faut enlever les anciennes ressources (v1 de datagouv) qui dupliquaient les données distantes ainsi que les données publiées via l’API sans préciser le type (file est le type attribué par défaut (?)).

Au final, il y a 1001 ressources qui sont servies par https://www.data.gouv.fr/storage/ (correspondant à 387 datasets) parmi lesquelles :

Top organisations

  • Ministère de l'Intérieur (136x)
  • None (131x)
  • Agence de services et de paiement (ASP) (96x)
  • ACTION Nogent-sur-Marne (81x)
  • Premier ministre (64x)

Le None est assez inquiétant, à investiguer.

Top licences

  • Licence Ouverte / Open Licence (695x)
  • License Not Specified (115x)
  • Open Data Commons Open Database License (ODbL) (86x)
  • Creative Commons CCZero (40x)
  • Creative Commons Attribution Share-Alike (25x)

Il faudrait se pencher sur les jeux de données sans licence, est-ce bien de l’opendata ?

Ressources privées

Il y a 212 ressources privées parmi ces 1001. Pourcentage non négligeable, à creuser.

Top titles

  • Elections municipales 2014

Sans trop de surprises vu le top organisations.

Top filetype

Il y a une seule ressource de type remote dans celles servies par https://www.data.gouv.fr/storage/, bug ?

Top formats

  • CSV (246x)
  • XLS (206x)
  • shp (101x)
  • PDF (59x)
  • ods (49x)

Attention, il n’y a pas de dédoublonnage lié à la casse donc ce n’est pas complètement pertinent. Mais ça donne une idée.

Top downloads

  • Largest value: 4 448
  • Sum: 24 929
  • Mean: 24,929
  • Median: 1
  • StDev: 179,84
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
You can’t perform that action at this time.