loleg/combine_data_by_egid.py

## combine_data_by_egid.py
import csv, io

# Configuration
input_addresses = "Gebaeudeadressen_1636760957021_53445 - Gebäudeadressen.csv"
egidcol_addresses = "Eidg. Gebäude-ID (EGID)"
input_opendata = "V20211111.csv"
egidcol_opendata = "egid"
output_filename = "combined.csv"

# Preload address file
with open(input_addresses, 'r') as csvfile:
    reader = csv.DictReader(csvfile)
    places = [dict(row) for row in reader]

# Process the open data
rowcount = 0
firstbase = False
with open(output_filename, 'w') as outfile:
    outwriter = csv.writer(outfile)
    with open(input_opendata, 'r') as bigfile:
        reader = csv.DictReader(bigfile, delimiter=";")
        for row in reader:
            egid = row[egidcol_opendata]
            for p in places:
                if p[egidcol_addresses] == egid:
                    for o in p:
                        row[o] = p[o]
                    if not firstbase:
                        outwriter.writerow(row)
                        firstbase = True
                    rowcount = rowcount + 1
                    outwriter.writerow([row[r] for r in row])
                    print('.', end="")

# Write a brief summary
print()
print("%d rows processed" % rowcount)
	import csv, io

	# Configuration
	input_addresses = "Gebaeudeadressen_1636760957021_53445 - Gebäudeadressen.csv"
	egidcol_addresses = "Eidg. Gebäude-ID (EGID)"
	input_opendata = "V20211111.csv"
	egidcol_opendata = "egid"
	output_filename = "combined.csv"

	# Preload address file
	with open(input_addresses, 'r') as csvfile:
	reader = csv.DictReader(csvfile)
	places = [dict(row) for row in reader]

	# Process the open data
	rowcount = 0
	firstbase = False
	with open(output_filename, 'w') as outfile:
	outwriter = csv.writer(outfile)
	with open(input_opendata, 'r') as bigfile:
	reader = csv.DictReader(bigfile, delimiter=";")
	for row in reader:
	egid = row[egidcol_opendata]
	for p in places:
	if p[egidcol_addresses] == egid:
	for o in p:
	row[o] = p[o]
	if not firstbase:
	outwriter.writerow(row)
	firstbase = True
	rowcount = rowcount + 1
	outwriter.writerow([row[r] for r in row])
	print('.', end="")

	# Write a brief summary
	print()
	print("%d rows processed" % rowcount)