Skip to content

Instantly share code, notes, and snippets.

@jtrecenti
Created April 10, 2017 19:21
Show Gist options
  • Save jtrecenti/e4d9f3eabb6c16b675252ca0be0f1707 to your computer and use it in GitHub Desktop.
Save jtrecenti/e4d9f3eabb6c16b675252ca0be0f1707 to your computer and use it in GitHub Desktop.
library(magrittr)
#url
u <- 'http://pesquisajuris.tjdft.jus.br/IndexadorAcordaos-web/sistj?visaoId=tjdf.sistj.acordaoeletronico.buscaindexada.apresentacao.VisaoBuscaAcordao&controladorId=tjdf.sistj.acordaoeletronico.buscaindexada.apresentacao.ControladorBuscaAcordao&visaoAnterior=tjdf.sistj.acordaoeletronico.buscaindexada.apresentacao.VisaoBuscaAcordao&nomeDaPagina=resultado&comando=abrirDadosDoAcordao&enderecoDoServlet=sistj&historicoDePaginas=buscaLivre&quantidadeDeRegistros=20&baseSelecionada=BASE_ACORDAO_TODAS&numeroDaUltimaPagina=1&buscaIndexada=1&mostrarPaginaSelecaoTipoResultado=false&totalHits=1&internet=1&numeroDoDocumento=1005250'
# usei html session pra economizar codigo de escrever o form inteiro
s <- rvest::html_session(u)
form <- rvest::html_form(s)[[1]] %>%
rvest::set_values(comando = 'downloadInteiroTeor')
s <- rvest::submit_form(s, form)
# pulo do gato tá aqui: o download vem de uma GET request com um codigo gerado na pagina da resposta do form
idd <- s$response %>%
httr::content('text') %>%
stringr::str_extract('idd=[0-9a-zA-Z]+')
# agora é só correr pro abraço
u_teor <- paste0(
"http://pesquisajuris.tjdft.jus.br/IndexadorAcordaos-web/infra/Download.jsp?",
idd
)
httr::GET(u_teor, httr::write_disk('arq.pdf', overwrite = TRUE))
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment