Sérgio Spagnuolo sergiospagnuolo

## openai_in_R.R
#####################################################
# Use GPT-3 in R with the OpenAI API. You need to install the reticulate package.
# Additionally, an API key is required that must be saved in a separate file, called .openaikey
# Get your API key here: https://openai.com/api/
#####################################################

# install.packages("reticulate") # run only once
library(reticulate)

# create python env

## get_cofog_data.r
library(readxl)
library(ckanr)
library(purrr)

ckanr::package_search()

package<- ckanr::package_show(id= "22d13d17-bf69-4a1a-add2-25cc1e25f2d7",
                              url= "https://www.tesourotransparente.gov.br/ckan") #busca todos os dados do dataset que se refere aos dados de COFOG


## stopwords_pt.R
### STOPWORDS IN PORTUGUESE

## Create a unique dataset from several datasets with stopwords in Portuguese

# Lucas Gelape

# Packages
library(dplyr)
library(stringi)
library(readr)

## get_last_covid_rt.r
#based on this method: https://github.com/k-sys/covid-19/blob/master/Realtime%20R0.ipynb
# In fact it is a translation from python to R of some parts of the code explained in the link above.

get_last_covid_rt<- function(df_days_case){ #this dataset must have a structre with a collumn no_cases (accumulated number of cases on a given sequence day)


  #smooth the data

  x <- 1:NROW(df_days_case)
  y<-df_days_case$no_cases

## ETL_pensionistas.R

library(readr)
library(dplyr)
PENSIONISTAS_112019 <- read_delim("Data/PENSIONISTAS_112019.csv",
                      ";", escape_double = FALSE, locale = locale(decimal_mark = ",",
                                                                  grouping_mark = ".", encoding = "LATIN1"),
                      trim_ws = TRUE)

PENSIONISTAS_122019 <- read_delim("Data/PENSIONISTAS_122019.csv",
                                  ";", escape_double = FALSE, locale = locale(decimal_mark = ",",

## atlas_connect.R
# Força o encoding para UTF-8, default do banco de dados
# Colaboração de Sérgio Spagnuolo (sergio@voltdata.info)
# Programa acessar a API do Atlas da Notícia (https://www.atlas.jor.br/)
# É necessário antes se cadastrar, veja como aqui: https://www.atlas.jor.br/plataforma/utilizarAPI/

library(httr)
library(jsonlite)

# Puxa os dados da sua credencial
token = content(

## script_indice_FIRJAN.R
# install.packages("devtools")
devtools::install_github("tchiluanda/rsiconfi")

library(rsiconfi)
library(dplyr)
library(tidyr)

###########Trabalhando as despesas

#Monta um vetor com todos os códigos de UFs do Brasil

## gist:40f7e6c0cf925065e21084062e5ad513
library(tabulizer)
library(dplyr)

setwd("~/GitHub/oleogate/data")

#Extrai tabelas do arquivo pdf.
#Esse arquivo foi baixado do seguinte link
# https://politica.estadao.com.br/blogs/estadao-verifica/wp-content/uploads/sites/690/2019/10/Ibama.pdf
#A tabela é extraída para um arquivo csv de forma a poder trabalhar melhor questões de encoding
tabulizer::extract_tables("ibama.pdf", output = "csv",outdir = getwd())

## notas.md

      
              2 files
            
          
              0 forks
            
          
              0 comments
            
          
              6 stars
            
          
                sergiospagnuolo
                / notas.md
            
            
              Last active
              April 29, 2020 01:33
            
              
                Buscas no Twitter por minuto
              
          
    Análise de buscas no Twitter no calor do momento

Este caderno contém funções para que seja possível medir o interesse de buscas no Twitter, com a finalidade de saber de algum assunto está realmente popular na rede social em certo momento. Por conta de limitações na API gratuita do Twitter, recomenda-se a utilização dessa metodologia para saber se um tópico foi popular no último dia ou período do dia.
Um exemplo de como isso foi usado pode ser visto neste tweet
Esta metodologia utiliza as bibliotecas de R Tidyverse e TwitteR para acessar os dados do Twitter.
Você também vai precisar de uma conta de desenvolvedor, a fim de conseguir todas as chaves de API para fazer as buscas (caso não tenha, garanto que é bem fácil).

  
## verba_ministerio_saude.ipynb

      
              1 file
            
          
              0 forks
            
          
              0 comments
            
          
              12 stars
            
          
                nportinari
                / verba_ministerio_saude.ipynb
            
            
              Last active
              March 12, 2020 17:40
            
              
                Verba - Ministério da Saúde
              
          
      Sorry, something went wrong. Reload?
      Sorry, we cannot display this file.
      Sorry, this file is invalid so it cannot be displayed.
      
          Viewer requires iframe.
	#####################################################
	# Use GPT-3 in R with the OpenAI API. You need to install the reticulate package.
	# Additionally, an API key is required that must be saved in a separate file, called .openaikey
	# Get your API key here: https://openai.com/api/
	#####################################################

	# install.packages("reticulate") # run only once
	library(reticulate)

	# create python env
	library(readxl)
	library(ckanr)
	library(purrr)

	ckanr::package_search()

	package<- ckanr::package_show(id= "22d13d17-bf69-4a1a-add2-25cc1e25f2d7",
	url= "https://www.tesourotransparente.gov.br/ckan") #busca todos os dados do dataset que se refere aos dados de COFOG
	### STOPWORDS IN PORTUGUESE

	## Create a unique dataset from several datasets with stopwords in Portuguese

	# Lucas Gelape

	# Packages
	library(dplyr)
	library(stringi)
	library(readr)
	#based on this method: https://github.com/k-sys/covid-19/blob/master/Realtime%20R0.ipynb
	# In fact it is a translation from python to R of some parts of the code explained in the link above.

	get_last_covid_rt<- function(df_days_case){ #this dataset must have a structre with a collumn no_cases (accumulated number of cases on a given sequence day)


	#smooth the data

	x <- 1:NROW(df_days_case)
	y<-df_days_case$no_cases

	library(readr)
	library(dplyr)
	PENSIONISTAS_112019 <- read_delim("Data/PENSIONISTAS_112019.csv",
	";", escape_double = FALSE, locale = locale(decimal_mark = ",",
	grouping_mark = ".", encoding = "LATIN1"),
	trim_ws = TRUE)

	PENSIONISTAS_122019 <- read_delim("Data/PENSIONISTAS_122019.csv",
	";", escape_double = FALSE, locale = locale(decimal_mark = ",",
	# Força o encoding para UTF-8, default do banco de dados
	# Colaboração de Sérgio Spagnuolo (sergio@voltdata.info)
	# Programa acessar a API do Atlas da Notícia (https://www.atlas.jor.br/)
	# É necessário antes se cadastrar, veja como aqui: https://www.atlas.jor.br/plataforma/utilizarAPI/

	library(httr)
	library(jsonlite)

	# Puxa os dados da sua credencial
	token = content(
	# install.packages("devtools")
	devtools::install_github("tchiluanda/rsiconfi")

	library(rsiconfi)
	library(dplyr)
	library(tidyr)

	###########Trabalhando as despesas

	#Monta um vetor com todos os códigos de UFs do Brasil
	library(tabulizer)
	library(dplyr)

	setwd("~/GitHub/oleogate/data")

	#Extrai tabelas do arquivo pdf.
	#Esse arquivo foi baixado do seguinte link
	# https://politica.estadao.com.br/blogs/estadao-verifica/wp-content/uploads/sites/690/2019/10/Ibama.pdf
	#A tabela é extraída para um arquivo csv de forma a poder trabalhar melhor questões de encoding
	tabulizer::extract_tables("ibama.pdf", output = "csv",outdir = getwd())