Instantly share code, notes, and snippets.

Embed
What would you like to do?
Tutoriel pour lire les fichiers FANTOIR de data.gouv.fr

Comment lire les fichiers FANTOIR ?

Télécharger le fichier

Dans un terminal (Mac OS / Linux)

$ mkdir fantoir
$ cd fantoir 
$ wget https://www.data.gouv.fr/fr/datasets/r/008e7b8f-f52c-4dc6-89ca-3bed2b103746
$ mv 008e7b8f-f52c-4dc6-89ca-3bed2b103746 fantoir.zip
$ unzip fantoir.zip

Regarder à quoi ressemble le fichier

$ more FANTOIR2017

On voit qu'il s'agit d'un fichier à largeur de colonne fixe (fixed width text file).

Lire le fichier dans R

On peut le lire facilement avec R et la librairie readr : http://readr.tidyverse.org/reference/read_fwf.html

  • La fonction fwf_empty() détecte automatiquement la largeur des colonnes

  • La fonction read_fwf() permet de lire le fichier.

  • L'option n_max permet de ne lire que les 1000 premières lignes. C'est utile pour faire des tests.

      library(readr)
      table_fantoir <- read_fwf(file="FANTOIR1017", fwf_empty("FANTOIR1017"), n_max = 100)   
    

Pour avoir un aperçu des données, on peut utiliser la fonction glimpse() de dplyr

    library(dplyr)
    table_fantoir %>% glimpse()
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment