brew/dedup.py

## dedup.py
import pandas

df = pandas.read_csv('OS_Presupuesto_2018CDMX.csv', encoding='latin_1')
df.drop_duplicates(inplace=True, subset=[
    "CICLO",
    "GOBIERNO_GEN",
    "SECTOR",
    "SUBSECTOR",
    "UNIDAD_RESPONSABLE",
    "FINALIDAD",
    "FUNCION",
    "SUBFUNCION",
    "AREA_FUNCIONAL",
    "PROGRAMA_PRESUPUESTARIO",
    "FUENTE_FINANCIAMIENTO",
    "ORIGEN_RECURSO",
    "CAPITULO",
    "CONCEPTO",
    "PARTIDA_GEN",
    "PARTIDA_ESP",
    "TIPO_GASTO",
    "PROYECTO_INV"]
)
df.to_csv('OS_Presupuesto_2018CDMX.deduped.csv', index=False)
	import pandas

	df = pandas.read_csv('OS_Presupuesto_2018CDMX.csv', encoding='latin_1')
	df.drop_duplicates(inplace=True, subset=[
	"CICLO",
	"GOBIERNO_GEN",
	"SECTOR",
	"SUBSECTOR",
	"UNIDAD_RESPONSABLE",
	"FINALIDAD",
	"FUNCION",
	"SUBFUNCION",
	"AREA_FUNCIONAL",
	"PROGRAMA_PRESUPUESTARIO",
	"FUENTE_FINANCIAMIENTO",
	"ORIGEN_RECURSO",
	"CAPITULO",
	"CONCEPTO",
	"PARTIDA_GEN",
	"PARTIDA_ESP",
	"TIPO_GASTO",
	"PROYECTO_INV"]
	)
	df.to_csv('OS_Presupuesto_2018CDMX.deduped.csv', index=False)