ivanvoid/main.py

## main.py
# Load data from files to dict
import os
import glob
import string
import unicodedata

all_letters = string.ascii_letters + " .,;'-"
category_lines = {}
all_categories = []

def findFiles(path): return glob.glob(path)

# Read a file and split into lines
def readLines(filename):
    with open(filename, encoding='utf-8') as some_file:
        return [unicodeToAscii(line.strip()) for line in some_file]

# Turn a Unicode string to plain ASCII, thanks to https://stackoverflow.com/a/518232/2809427
def unicodeToAscii(s):
    return ''.join(
        c for c in unicodedata.normalize('NFD', s)
        if unicodedata.category(c) != 'Mn'
        and c in all_letters
    )

# Build the category_lines dictionary, a list of lines per category
for filename in findFiles('data/names/*.txt'):
    category = os.path.splitext(os.path.basename(filename))[0]
    all_categories.append(category)
    lines = readLines(filename)
    category_lines[category] = lines
	# Load data from files to dict
	import os
	import glob
	import string
	import unicodedata

	all_letters = string.ascii_letters + " .,;'-"
	category_lines = {}
	all_categories = []

	def findFiles(path): return glob.glob(path)

	# Read a file and split into lines
	def readLines(filename):
	with open(filename, encoding='utf-8') as some_file:
	return [unicodeToAscii(line.strip()) for line in some_file]

	# Turn a Unicode string to plain ASCII, thanks to https://stackoverflow.com/a/518232/2809427
	def unicodeToAscii(s):
	return ''.join(
	c for c in unicodedata.normalize('NFD', s)
	if unicodedata.category(c) != 'Mn'
	and c in all_letters
	)

	# Build the category_lines dictionary, a list of lines per category
	for filename in findFiles('data/names/*.txt'):
	category = os.path.splitext(os.path.basename(filename))[0]
	all_categories.append(category)
	lines = readLines(filename)
	category_lines[category] = lines