mlai-demo/te5.py

## te5.py
from nltk.stem.porter import PorterStemmer
with open(fpath + '/Plutarch_tokens.txt') as f, open(fpath + '/Plutarch_stem.txt', 'w') as out_f:
    text = f.read()
    tokens = word_tokenize(text)
    porter = PorterStemmer()
    stemmed = [porter.stem(word) for word in tokens]
    print(stemmed[:100])
    new_stem_text = ' '.join(stemmed)
    fd_stemmed = nltk.FreqDist(stemmed)
    out_f.write(new_stem_text)


nltk.download('wordnet') #need if using Google Colab
from nltk.stem import WordNetLemmatizer

with open(fpath + '/Plutarch_tokens.txt') as f, open(fpath + '/Plutarch_lemma.txt', 'w') as out_f:
    text = f.read()
    tokens = word_tokenize(text)
    lemma = WordNetLemmatizer()
    lemmed = [lemma.lemmatize(word) for word in tokens]
    print(lemmed[:100])
    new_lem_text = ' '.join(lemmed)
    out_f.write(new_lem_text)
	from nltk.stem.porter import PorterStemmer
	with open(fpath + '/Plutarch_tokens.txt') as f, open(fpath + '/Plutarch_stem.txt', 'w') as out_f:
	text = f.read()
	tokens = word_tokenize(text)
	porter = PorterStemmer()
	stemmed = [porter.stem(word) for word in tokens]
	print(stemmed[:100])
	new_stem_text = ' '.join(stemmed)
	fd_stemmed = nltk.FreqDist(stemmed)
	out_f.write(new_stem_text)


	nltk.download('wordnet') #need if using Google Colab
	from nltk.stem import WordNetLemmatizer

	with open(fpath + '/Plutarch_tokens.txt') as f, open(fpath + '/Plutarch_lemma.txt', 'w') as out_f:
	text = f.read()
	tokens = word_tokenize(text)
	lemma = WordNetLemmatizer()
	lemmed = [lemma.lemmatize(word) for word in tokens]
	print(lemmed[:100])
	new_lem_text = ' '.join(lemmed)
	out_f.write(new_lem_text)