Skip to content

Instantly share code, notes, and snippets.

View cecilesauder's full-sized avatar

Cécile Sauder cecilesauder

View GitHub Profile
``` r
library(tidyverse)
library(lubridate)
#>
#> Attachement du package : 'lubridate'
#> The following object is masked from 'package:base':
#>
#> date
df <- tibble(Evt = c("F", "O", "F", "O", "O", "F", "F"),
date_time = as_datetime(c("2019-01-22 09:37:56",
@cecilesauder
cecilesauder / euh.R
Created December 19, 2018 11:15
commentje fais pour pas avoir de "," a la fin ?
``` r
library(glue)
names = c("var1", "var2", "var3")
glue_index <- function(vect_names){
glue('"{vect_names}" = 4,')
}
glue_index(names)
#> "var1" = 4,
#> "var2" = 4,
@cecilesauder
cecilesauder / gist:7e431f2b341f70df9853e995672c09e3
Last active December 6, 2018 09:42
Si je join par c("Name", "Species"), je récupère pas les Species et Gender de df2, même si y a pas d'ambiguité, Si je join juste par Name j'ai des doublons de Name pour un DOG qui aurait le même Name qu'un CAT de df2, moi je voudrais que ça me sorte le premier tableau mais sans les NA , c'est possible ?
``` r
library(tidyverse)
df1 <- tibble(Name = c("Pastis", "Mojito", "Binouze"),
Species = c("CAT", NA, "DOG"))
df2 <- tibble(Name = c("Pastis", "Mojito", "Binouze", "Jack", "Binouze"),
Species = c("CAT", "CAT", "DOG", "DOG", "CAT"),
Gender = c("M", "M", "F", "M", "F"))
@cecilesauder
cecilesauder / gist:a2909f7ae0507d533257b230fc83b0fc
Created December 6, 2018 09:32
Est ce que y a une option pour que Mojito récupère Species et Gender de df2 , sans que je join que par Name parce que j'ai des animaux qui ont le même nom c'est relou
``` r
library(tidyverse)
df1 <- tibble(Name = c("Pastis", "Mojito", "Binouze"),
Species = c("CAT", NA, "DOG"))
df2 <- tibble(Name = c("Pastis", "Mojito", "Binouze", "Jack"),
Species = c("CAT", "CAT", "DOG", "DOG"),
Gender = c("M", "M", "F", "M"))
``` r
library(pdftools)
library(tidyverse)
publi_pdf <- pdf_text("https://www.ncbi.nlm.nih.gov/pmc/articles/PMC6060449/pdf/12917_2018_Article_1517.pdf")
publi_lines <- publi_pdf %>%
map(1:length(publi_pdf), readr::read_lines())
@cecilesauder
cecilesauder / tidytext_dplyr5000_commits.md
Created October 12, 2018 23:15
Wordcloud of #dplyr5000 commits
library(tidyverse)
library(tidytext)
library(RColorBrewer)
library(wordcloud)
#install_github("romainfrancois/dplyr5000")
library(dplyr5000)

#tokenization 
tib_words &lt;- dplyr5000 %&gt;%
@cecilesauder
cecilesauder / dplyr5000.md
Last active October 13, 2018 00:41
ggplot for people who made more than 40 #dplyr travis builds
#devtools::install_github("r-lib/gh")
library(gh)
#devtools::install_github("romainfrancois/dplyr5000")
library(dplyr5000)
library(tidyverse)
library(grid) 
library(magick)
#> Linking to ImageMagick 6.9.7.4
#> Enabled features: fontconfig, freetype, fftw, lcms, pango, x11
@cecilesauder
cecilesauder / dplyr5000.md
Created October 10, 2018 20:38
#dplyr successful travis build times
library(tidyverse)
library(dplyr5000)

dplyr5000 %>%
  mutate(time_min = as.numeric(finished_at - started_at) / 60 ) %>%
  filter(time_min > 0, state == "passed") %>%
  ggplot(aes(x=finished_at, y = time_min)) +
  geom_point() +
 geom_smooth(method = "auto", formula = y ~ x, se = FALSE, size = 2, color = "#9900CC") +
library(dplyr)
#si tu l'as pas : install.packages("dplyr")
#lecture des fichiers
data_train <- read.csv(file = "/home/cecile/Documents/R/train.csv")
data_test <- read.csv(file = "/home/cecile/Documents/R/test.csv")
#glimpse c'est juste une autre sorte de summary et le %>% si tu connais pas c'est la syntaxe du package dplyr
#c'est exactement comme ecrire glimpse(data_train) sauf que cette syntaxe ecrit sujet %>% verbe au lieu de verbe(sujet)
#c'est plus lisible et plus fashion lol