HoffmannP/countUCLetters.py

## countUCLetters.py
#!/usr/bin/env python

import re

IGNORE_BEGINNING = True

allUppercase = re.compile(r'[A-ZÄÜÖ][A-ZÄÜÖ]+')

matchLetters = re.compile(r'[a-zäüößA-ZÄÜÖ]')
matchUCLetters = re.compile(r'[A-ZÄÜÖ]')

# Source https://www.biblesupersearch.com/bible-downloads/
for name in ['kjv.txt', 'luther.txt']:
    letters = 0
    ucletters = 0

    with open(name) as f:
        for line in f:
            words = line.split(' ')
            if len(words) < 4:
                continue
            first_word = 2
            if ':' in words[first_word]:
                first_word += 1
            if words[first_word] == '¶':
                first_word += 1
            if IGNORE_BEGINNING:
                first_word += 1
            sentence = ' '.join(
                filter(
                    lambda word: allUppercase.match(word) is None,
                    words[first_word:]))

            letters += len(matchLetters.findall(sentence))
            ucletters += len(matchUCLetters.findall(sentence))

    book_name = name.split(".")[0]
    percentage = 100 * ucletters / letters
    print(f'{book_name}:\t{percentage:.1f}%\t({letters}/{ucletters})')
	#!/usr/bin/env python

	import re

	IGNORE_BEGINNING = True

	allUppercase = re.compile(r'[A-ZÄÜÖ][A-ZÄÜÖ]+')

	matchLetters = re.compile(r'[a-zäüößA-ZÄÜÖ]')
	matchUCLetters = re.compile(r'[A-ZÄÜÖ]')

	# Source https://www.biblesupersearch.com/bible-downloads/
	for name in ['kjv.txt', 'luther.txt']:
	letters = 0
	ucletters = 0

	with open(name) as f:
	for line in f:
	words = line.split(' ')
	if len(words) < 4:
	continue
	first_word = 2
	if ':' in words[first_word]:
	first_word += 1
	if words[first_word] == '¶':
	first_word += 1
	if IGNORE_BEGINNING:
	first_word += 1
	sentence = ' '.join(
	filter(
	lambda word: allUppercase.match(word) is None,
	words[first_word:]))

	letters += len(matchLetters.findall(sentence))
	ucletters += len(matchUCLetters.findall(sentence))

	book_name = name.split(".")[0]
	percentage = 100 * ucletters / letters
	print(f'{book_name}:\t{percentage:.1f}%\t({letters}/{ucletters})')