Skip to content

Instantly share code, notes, and snippets.

View jmcastagnetto's full-sized avatar
🇵🇪
Focusing

Jesus M. Castagnetto jmcastagnetto

🇵🇪
Focusing
View GitHub Profile
@jmcastagnetto
jmcastagnetto / fragment-settings.json
Created September 20, 2021 15:59
Changes in VSCode "settings.json" to get "rainbow brackets" with Okabe-Ito colorblind-friendly colors in light themes
// compatible with VSCode version 1.60.1 (or later)
"workbench.colorTheme": "Default Light+",
"editor.bracketPairColorization.enabled": true,
"workbench.colorCustomizations": {
// Okabe-Ito colors (colorblind-friendly)
"editorBracketHighlight.foreground1": "#000000", // black
"editorBracketHighlight.foreground2": "#e69f00", // orange
"editorBracketHighlight.foreground3": "#56b4e9", // sky blue
"editorBracketHighlight.foreground4": "#009e73", // bluish green
"editorBracketHighlight.foreground5": "#0072b2", // blue
@jmcastagnetto
jmcastagnetto / README.md
Last active August 21, 2021 23:49
Información extra de los linajes de SARS-COV-2 detectados en Perú

Usando los datos del "Dataset de Pruebas Moleculares del Instituto Nacional de Salud - INS" al 2021-08-20, y combinando la información con datos de https://cov-lineages.org/lineage_list.html, a continuación se tiene la información extendida de los linajes de SARS-COV-2 en Perú, hasta la fecha.

El campo de frequency tiene el número de registros que mencionan un linaje en particular, y el de result tiene el valor consignado originalmente en el dataset del INS mencionado arriba.

Estructura de datos

name width type
lineage 12 str
frequency 11 int
@jmcastagnetto
jmcastagnetto / README.md
Last active August 21, 2021 18:06
Intento de encontrar un esquema para los datos de la Datatón 2021 del MINSA

Datatón 2021 del MINSA

Esta información trata de diagramar un esquema aproximado de (casi) todos los datos que se han liberado hasta la fecha para la Datatón 2021 del MINSA.

Me he basado en las estructuras de los datos, en particular los datos de tb_persona y un campo id_persona, que es referido en varios de los CSVs que han sido puestos como datos abiertos.

También he puesto varios FK entre tablas, en base a los nombres. No he revisado que todos los FK funcionen con todos los datos que se han liberado, pero al menos, funciona el tener tb_sinadef.id_persona -> tb_persona.id_persona (por ejemplo).

@jmcastagnetto
jmcastagnetto / diferencias.txt
Created August 6, 2021 03:38
Diferencias en datos de vacunación entre commits a74908 y b7ef70, para datos/vacunas_covid_resumen.csv (https://github.com/jmcastagnetto/covid-19-peru-vacunas/)
# Generado usando daff
--- a/datos/vacunas_covid_resumen.csv
+++ b/datos/vacunas_covid_resumen.csv
@@,fecha_corte,fecha_vacunacion,fabricante,dosis,n_reg
,2021-08-03,2021-02-08,PFIZER,1,1
->,2021-08-03,2021-02-09,SINOPHARM,1,1946->3845
->,2021-08-03,2021-02-10,SINOPHARM,1,7551->16583
,2021-08-03,2021-02-11,PFIZER,1,2
->,2021-08-03,2021-02-11,SINOPHARM,1,16792->34108
,2021-08-03,2021-02-12,ASTRAZENECA,1,1
@jmcastagnetto
jmcastagnetto / theme.rstheme
Created July 14, 2021 02:09
Fragment to add to an *.rstheme to get Okabe-Ito colored "rainbow" parentheses
/* this is just a fragment to change the color of the "rainbow" color parentheses */
/* the colors below come from the Okabe-Ito palette */
.ace_paren_color_0 {
color: #000000 !important; /* black */
font-weight: bold;
}
.ace_paren_color_1 {
color: #e69f00 !important; /* orange */
font-weight: bold;
}
@jmcastagnetto
jmcastagnetto / test-katex.Rmd
Created July 13, 2021 00:02
Testing the rOpenSci {katex} package
---
title: "Testing rOpenSci katex"
author: "Jesus M. Castagnetto"
date: "2021-07-12"
output:
html_document:
mathjax: null
---
```{r setup, include=FALSE}
We can make this file beautiful and searchable if this error is corrected: It looks like row 3 should actually have 8 columns, instead of 5. in line 2.
id,name,description,country,profession,topics,img,url
1549,Pedro Chávez Zavala,"Médico militar egresado de la Escuela Médico Militar en 1988. Ostenta el grado de coronel. Egresado del Colegio Nacional de Acupuntura en 1993. Tiene un diplomado en Medicina Cuántica. Es presidente de la Coalición Mundial Salud y Vida (COMUSAV) Agrupación México, la cual promueve el uso del dióxido de cloro, así como terapias “bioenergéticas”.",México,Médico,"Falsas terapias covid-19,Propagación del virus",https://saludconlupa.com/media/images/Pedro-Chavez.2e16d0ba.fill-400x400.jpg,https://saludconlupa.com/series/desinformantes/pedro-chavez-zavala/
1571,Atilio Fariña del Río,"Presidente del Consorcio Paraguayo de Médicos Católicos y de la Federación de Asociaciones por la Vida y la Familia. En el 2005, participó en representación de la Conferencia Episcopal Paraguaya en un congreso organizado por el Consejo Pontificio para la Pastoral de la Salud, que reunió a científicos, filósofos y teólogos en el Vaticano.",Paraguay,Médico gin
@jmcastagnetto
jmcastagnetto / test-readr-datatable-vroom.R
Created July 1, 2021 15:39
Testing readr::read_csv(), data.table::fread() and vroom::vroom()
# Test done to check/answer the question at https://stackoverflow.com/questions/68211842/why-is-vroom-so-slow
# Downloaded CSV file on 2021-07-01 from:
# https://www.datosabiertos.gob.pe/dataset/vacunaci%C3%B3n-contra-covid-19-ministerio-de-salud-minsa
# and then compressed it with gzip
# $ zcat vacunas_covid.csv.gz | wc -l
# 7311644
library(readr)
library(vroom)
library(data.table)
@jmcastagnetto
jmcastagnetto / descargar_datos.R
Created June 18, 2021 00:45
Descargar a CSV los datos de elecciones 2021 (Perú) de ronderos.pe
library(tidyverse)
base_url <- "https://ronderos.pe/datasette/elecciones_peru_2021/presidencial.csv?_size=1000&_next={next_val}"
spec <- cols(
.default = col_integer(),
mesa = col_character(),
v2_OBSERVACION = col_character(),
v2_OBSERVACION_TXT = col_character(),
v1_OBSERVACION = col_character(),
library(tidyverse)
library(rvest)
library(V8)
url <- "https://www.greatschools.org/new-york/new-york/schools/?view=table"
xpath <- "/html/head/script[1]"
ctx <- v8()
txt <- read_html(url) %>%