Skip to content

Embed URL

HTTPS clone URL

Subversion checkout URL

You can clone with
or
.
Download ZIP
parser de municipios de argentina
PROVINCIA MUNICIPIO INTENDENTE PARTIDO POLITICO RELECTO
Buenos Aires Adolfo Alsina Alberto GUTT Frente para la Victoria Si
Buenos Aires Adolfo Gonzáles Chaves José MARTINEZ Partido Vecinal No
Buenos Aires Alberti Leonel Omar ZACCA Frente para la Victoria Si
Buenos Aires Almirante Brown Ruben Dario GIUSTOZZI Frente para la Victoria No
Buenos Aires Avellaneda Jorge FERRARESI Frente para la Victoria Si
Buenos Aires Ayacucho Dario DAVID Frente para la Victoria Si
Buenos Aires Azul Omar Arnaldo DUCLÓS Frente Coalición Cívica Si
Buenos Aires Bahía Blanca Cristian BREITENSTEIN Frente para la Victoria Si
Buenos Aires Balcarce José Enrique ECHEVERRÍA Frente para la Victoria No
#encoding: utf-8
=begin
ref: https://gist.github.com/1306518
Cosas que interesan
-------------------
El nombre de la Provicia - value del hash de provincias obtenido previamente
Municipio - /html/body/div/div[2]/table/tr/th[2]/div[2]/h1
Nombre y Apellido - /html/body/div/div[2]/table/tr/th[2]/div[2]/table/tr/td[2]/strong
Partido politico - /html/body/div/div[2]/table/tr/th[2]/div[2]/table/tr[3]/td[2]/strong
Reelecto - /html/body/div/div[2]/table/tr/th[2]/div[2]/table/tr[5]/td[2]/strong
=end
require 'nokogiri'
require 'open-uri'
=begin
# este hash es la representacion del combo de provincias que esta aqui http://www.mininterior.gov.ar/municipios/buscador_municipios.php?provincia=BUE&municipio2=BUE008&buscamun2=Buscar&idName=municipios&idNameSubMenu=municipiosMun&idNameSubMenuDer=&idNameSubMenuDerNivel2=&idNameSubMenuDerPrincipal=
# approach para sacar el listado de provincias para iterar
# en consola shell tiramos
$ nokogiri "http://www.mininterior.gov.ar/municipios/buscador_municipios.php?idName=municipios&idNameSubMenu=municipiosMun"
#una vez abierto el irb tiramos
> @doc.search("select#provincia").children[1..-1].map{|o|{o['value'] => o.content.strip}}
=> [{"BUE"=>"Buenos Aires"}, {"CAT"=>"Catamarca"}, {"CHA"=>"Chaco"}, {"CHU"=>"Chubut"}, {"CBA"=>"Córdoba"}, {"COR"=>"Corrientes"}, {"ERI"=>"Entre Ríos"}, {"FOR"=>"Formosa"}, {"JUJ"=>"Jujuy"}, {"LAP"=>"La Pampa"}, {"LRJ"=>"La Rioja"}, {"MZA"=>"Mendoza"}, {"MIS"=>"Misiones"}, {"NEU"=>"Neuquén"}, {"RNO"=>"Río Negro"}, {"SAL"=>"Salta"}, {"SJU"=>"San Juan"}, {"SLU"=>"San Luis"}, {"SCR"=>"Santa Cruz"}, {"SFE"=>"Santa Fe"}, {"SGO"=>"Santiago del Estero"}, {"TDF"=>"Tierra del Fuego"}, {"TUC"=>"Tucumán"}]
=end
provinces=[{"BUE"=>"Buenos Aires"}, {"CAT"=>"Catamarca"}, {"CHA"=>"Chaco"}, {"CHU"=>"Chubut"}, {"CBA"=>"Córdoba"}, {"COR"=>"Corrientes"}, {"ERI"=>"Entre Ríos"}, {"FOR"=>"Formosa"}, {"JUJ"=>"Jujuy"}, {"LAP"=>"La Pampa"}, {"LRJ"=>"La Rioja"}, {"MZA"=>"Mendoza"}, {"MIS"=>"Misiones"}, {"NEU"=>"Neuquén"}, {"RNO"=>"Río Negro"}, {"SAL"=>"Salta"}, {"SJU"=>"San Juan"}, {"SLU"=>"San Luis"}, {"SCR"=>"Santa Cruz"}, {"SFE"=>"Santa Fe"}, {"SGO"=>"Santiago del Estero"}, {"TDF"=>"Tierra del Fuego"}, {"TUC"=>"Tucumán"}]
$stdout.puts "PROVINCIA, MUNICIPIO, INTENDENTE, PARTIDO POLITICO, RELECTO"
$stdout.flush
provinces.each do |province|
code, name = province.first
1.upto(999) do |i|
# http://www.mininterior.gov.ar/municipios/masinfo.php?municipio=BUE008
url = "http://www.mininterior.gov.ar/municipios/masinfo.php?municipio=#{code}#{"%03.0f" % i}"
doc = Nokogiri::HTML(open(url).read)
begin
municipio = doc.at('/html/body/div/div[2]/table/tr/th[2]/div[2]/h1').content
break if municipio.nil? || municipio.empty?
rescue
break
end
intendente = doc.at('/html/body/div/div[2]/table/tr/th[2]/div[2]/table/tr/td[2]/strong').content
partido_politico = doc.at('/html/body/div/div[2]/table/tr/th[2]/div[2]/table/tr[3]/td[2]/strong').content
relecto = doc.at('/html/body/div/div[2]/table/tr/th[2]/div[2]/table/tr[5]/td[2]/strong').content
$stdout.puts "#{name}, #{municipio}, #{intendente}, #{partido_politico}, #{relecto}"
$stdout.flush
end
end
@tematres

Hola lguardiola, hay otro portal de gobierno con los indicadores del indec y datos actualizados que permite consultar los datos vía una API y los devuelte en XML. La API requiere login... que se les da todos los municipios.... sos de algún municipio? este es el portal www.gobiernolocal.gov.ar y aquí el Atlas http://www.gobiernolocal.gob.ar/index.php?option=com_content&view=article&id=90&Itemid=15

saludos

@lguardiola
Owner

No entiendo que necesitarias que haga con eso. Si me definis que queres armo el scrapper.

@tematres

hola :) no nada... el scrapper así como esta esta super :). Es sólo que si necesitabas una fuente de datos de municipios en XML y accesible vía web services... el sitio gobiernolocal.gov.ar expone web services con datos de identificación de municipios, geolocalización, gobierno, partido político y período, indicadores estadísticos etc. Estos datos están directamente en XML ... no hace falta scrapper. Pero son accesibles sólo para municipios. eso nomás :/. Muy bueno el script para crawlear los datos directamente desde mininterior :)

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Something went wrong with that request. Please try again.