KTBL-JaschaJung

## pdf_to_text.py
from tika import parser
import os


def extract_text_from_pdfs_recursively(dir):
    for root, dirs, files in os.walk(dir):
        for file in files:
            path_to_pdf = os.path.join(root, file)
            [stem, ext] = os.path.splitext(path_to_pdf)
            if ext == '.pdf':
	from tika import parser
	import os


	def extract_text_from_pdfs_recursively(dir):
	for root, dirs, files in os.walk(dir):
	for file in files:
	path_to_pdf = os.path.join(root, file)
	[stem, ext] = os.path.splitext(path_to_pdf)
	if ext == '.pdf':