Skip to content

Instantly share code, notes, and snippets.

View pachevalier's full-sized avatar

Paul-Antoine pachevalier

  • Paris
View GitHub Profile
library(tidyverse)
# Source https://www.douane.gouv.fr/la-douane/opendata?f%5B0%5D=categorie_opendata_facet%3A459&recherche_opendata=&op=
# https://www.douane.gouv.fr/sites/default/files/2022-03/14/202201-stat-national-ce-import.zip
"data/stat-national-ce-import/Libelle_PAYS.txt" %>%
read_csv2()
"data/stat-national-ce-import/NATIONAL_NC8PAYSI.txt" %>%
read_csv2(
.,
library(tidyverse)
# Source https://www.douane.gouv.fr/la-douane/opendata?f%5B0%5D=categorie_opendata_facet%3A459&recherche_opendata=&op=
# https://www.douane.gouv.fr/sites/default/files/2022-03/14/202201-stat-national-ce-import.zip
"data/stat-national-ce-import/Libelle_PAYS.txt" %>%
read_csv2()
"data/stat-national-ce-import/NATIONAL_NC8PAYSI.txt" %>%
read_csv2(
.,

Contexte

En application de la loi n°2019-828 du 6 août 2019 :

  • les ministères ;
  • les collectivités territoriales ;
  • les EPCI de plus de 80 000 habitants ;
  • et les établissements hospitaliers avec un budget de plus de 200 millions d'euros

doivent publient annuellement la somme des 10 plus grosses rémunérations brutes, le nombre de femmes et le nombre d'hommes concernés.

library("tidyverse")
library("tricky")
library("hrbrthemes")
url <- "https://static.data.gouv.fr/resources/budget-de-la-cnil-1/20200706-112019/opencnil-budget-depuis-2000.csv"
read_csv2(file = url) %>%
filter(is.na(Année) == FALSE) %>%
pivot_longer(-Année, names_to = "year") %>%
rename(budget = Année) %>%
library(yaml)
library(httr)
library(tidyverse)
library(magrittr)
library(lubridate)
library(ggthemes)
GET("https://raw.githubusercontent.com/opencovid19-fr/data/master/sante-publique-france/2020-03-04.yaml") %>%
content() %>%
yaml.load() %>%

Rapide exploration des données decp

Téléchargement des données

$ mkdir decp
$ cd decp
$ wget https://static.data.gouv.fr/resources/fichiers-consolides-des-donnees-essentielles-de-la-commande-publique/20200123-053915/decp.json

Nombre de marchés

---
title: "R Notebook"
output:
html_document:
df_print: paged
---
```{r setup}
library(banR)
library(tidyverse)
library("readxl")
library("dplyr")
read_excel("maires-17-06-2014.xlsx", skip = 1) %>%
glimpse()
# library("devtools")
# install_github("pachevalier/tricky")
library("readxl")
library("dplyr")
library("tricky")

Problème

y : la part de vote en faveur du candiat A au second tour x_1 : la part de vote en faveur du candidat A au premier tour x_2 : la part de vote en faveur du candidat B au premier tour x_3 : la part de vote en faveur du candidat C au premier tour

On sait que $\sum_k x_k = 1$

On a donc une relation de colinéarité entre les variables explicatives.

@pachevalier
pachevalier / tutoriel_fantoir.md
Last active June 25, 2021 10:57
Tutoriel pour lire les fichiers FANTOIR de data.gouv.fr