kadster/Nicole_code.py

## Nicole_code.py
import os
from bs4 import BeautifulSoup

folder = '/Users/nt/Desktop/letters'
files = os.listdir(folder)
tagnames = ['persName', 'abstract', 'date', 'transcription']

files = [f for f in files if 'xml' in f]

output_strs = []

for fname in files:
    with open(os.path.join(folder, fname), "r") as infile:

        file_data= ""
        content = infile.read()
        soup = BeautifulSoup(content,'xml')
        for tagname in tagnames:
            tag_data = soup.find(tagname)
            tag_text = tag_data.get_text()
            file_data += tag_text
            file_data += '\t'
            tagnames.append(tag_text)
            tagnames_str = "\t".join(tagnames)

        output_strs.append("{}\t{}\n".format(fname, text.replace('\n', ' ')))

print(len(output_strs))
with open('/Users/nt/Desktop/tagdata.dat', 'w') as outfile:
    outfile.writelines(output_strs)
print('yo dude im finito')
	import os
	from bs4 import BeautifulSoup

	folder = '/Users/nt/Desktop/letters'
	files = os.listdir(folder)
	tagnames = ['persName', 'abstract', 'date', 'transcription']

	files = [f for f in files if 'xml' in f]

	output_strs = []

	for fname in files:
	with open(os.path.join(folder, fname), "r") as infile:

	file_data= ""
	content = infile.read()
	soup = BeautifulSoup(content,'xml')
	for tagname in tagnames:
	tag_data = soup.find(tagname)
	tag_text = tag_data.get_text()
	file_data += tag_text
	file_data += '\t'
	tagnames.append(tag_text)
	tagnames_str = "\t".join(tagnames)

	output_strs.append("{}\t{}\n".format(fname, text.replace('\n', ' ')))

	print(len(output_strs))
	with open('/Users/nt/Desktop/tagdata.dat', 'w') as outfile:
	outfile.writelines(output_strs)
	print('yo dude im finito')