tangotiger/parseSchedule.py

## parseSchedule.py
print("Parse start")

sourcefile = "C:\\Users\\TOM\\PycharmProjects\\downloadNHL\\datafiles\\schedulebyseason.htm"
targetfile = "C:\\Users\\TOM\\PycharmProjects\\downloadNHL\\datafiles\\parsed_schedulebyseason.txt"

searchstr = "recap?id="

sample_recstr = "2015020001"
reclen = len(sample_recstr)

i = 0

with open(sourcefile,'r') as infile, open(targetfile,'w') as outfile:
    for line in infile:
        line_iterator = str(line).split(searchstr)
        if len(line_iterator) > 1:
            game_id = line_iterator[1][0:reclen]
            outfile.write(game_id)
            outfile.write("\n")
            i = i + 1

print(str(i) + " : records written")
print("Parse end")
	print("Parse start")

	sourcefile = "C:\\Users\\TOM\\PycharmProjects\\downloadNHL\\datafiles\\schedulebyseason.htm"
	targetfile = "C:\\Users\\TOM\\PycharmProjects\\downloadNHL\\datafiles\\parsed_schedulebyseason.txt"

	searchstr = "recap?id="

	sample_recstr = "2015020001"
	reclen = len(sample_recstr)

	i = 0

	with open(sourcefile,'r') as infile, open(targetfile,'w') as outfile:
	for line in infile:
	line_iterator = str(line).split(searchstr)
	if len(line_iterator) > 1:
	game_id = line_iterator[1][0:reclen]
	outfile.write(game_id)
	outfile.write("\n")
	i = i + 1

	print(str(i) + " : records written")
	print("Parse end")