Amaan Rizvi amnrzv

## nltk_pos_tags
POS tag list:

CC	coordinating conjunction
CD	cardinal digit
DT	determiner
EX	existential there (like: "there is" ... think of it like "there exists")
FW	foreign word
IN	preposition/subordinating conjunction
JJ	adjective	'big'
JJR	adjective, comparative	'bigger'

## prices.json
{
	"products": [
		{
			"productId": 1,
			"purchaseable": true,
			"prices": {
				"usd": 1750,
				"gbp": 1250
			}
		},

## a_PhoneticTranslations_main.py
import urllib.request
import urllib.error
import urllib.parse
import re
from bs4 import BeautifulSoup
from bs4 import UnicodeDammit

lines = []
base_url = "http://www.phonemicchart.com/transcribe/?w=%s"
output_file = open("output.txt", 'w', encoding='utf-8')

## nltk_pos_workaround.py
import nltk
import re
from nltk.tokenize import word_tokenize, sent_tokenize

text = "I'm not going to the party."

words = word_tokenize(text)
pos_tags = nltk.pos_tag(words)

print (pos_tags)

## ntlk_lemmatizer.py
from nltk.stem import WordNetLemmatizer

wordnet_lemmatizer = WordNetLemmatizer()

print (wordnet_lemmatizer.lemmatize("geese"))
print (wordnet_lemmatizer.lemmatize("bottles", 'n'))
print (wordnet_lemmatizer.lemmatize("said", 'v'))
print (wordnet_lemmatizer.lemmatize("better", 'a'))
print (wordnet_lemmatizer.lemmatize("quickly", 'r'))

## nltk_pos_tags.py
import nltk
from nltk.tokenize import word_tokenize, sent_tokenize

text1 = "I'm going to watch a play tonight."
text2 = "I like to play guitar."

words1 = word_tokenize(text1)
pos_tags1 = nltk.pos_tag(words1)

words2 = word_tokenize(text2)

## nltk_tokenize.py
from nltk.tokenize import word_tokenize, sent_tokenize

text = "Hello, Mr. Jacobs. Nice to meet you!"

sentences = sent_tokenize(text)
words = word_tokenize(text)

print (sentences)
print (words)

## a_language_analysis.py
import nltk
import re
from nltk.tokenize import word_tokenize
from nltk.stem import WordNetLemmatizer

input_file = "./input.txt"
words_file = "./words.txt"
output_file = "./output.txt"
curriculum_words = []
pos_tagged_array = []

## output.txt
act             |          0
be              |          6
begin           |          0
believe         |          0
break           |          0
call            |          0
can             |          5
change          |          0
choose          |          0
clean           |          0

## words.txt
act
be
begin
believe
break
call
can
change
choose
clean
	POS tag list:

	CC coordinating conjunction
	CD cardinal digit
	DT determiner
	EX existential there (like: "there is" ... think of it like "there exists")
	FW foreign word
	IN preposition/subordinating conjunction
	JJ adjective 'big'
	JJR adjective, comparative 'bigger'
	{
	"products": [
	{
	"productId": 1,
	"purchaseable": true,
	"prices": {
	"usd": 1750,
	"gbp": 1250
	}
	},
	import urllib.request
	import urllib.error
	import urllib.parse
	import re
	from bs4 import BeautifulSoup
	from bs4 import UnicodeDammit

	lines = []
	base_url = "http://www.phonemicchart.com/transcribe/?w=%s"
	output_file = open("output.txt", 'w', encoding='utf-8')
	import nltk
	import re
	from nltk.tokenize import word_tokenize, sent_tokenize

	text = "I'm not going to the party."

	words = word_tokenize(text)
	pos_tags = nltk.pos_tag(words)

	print (pos_tags)
	from nltk.stem import WordNetLemmatizer

	wordnet_lemmatizer = WordNetLemmatizer()

	print (wordnet_lemmatizer.lemmatize("geese"))
	print (wordnet_lemmatizer.lemmatize("bottles", 'n'))
	print (wordnet_lemmatizer.lemmatize("said", 'v'))
	print (wordnet_lemmatizer.lemmatize("better", 'a'))
	print (wordnet_lemmatizer.lemmatize("quickly", 'r'))
	import nltk
	from nltk.tokenize import word_tokenize, sent_tokenize

	text1 = "I'm going to watch a play tonight."
	text2 = "I like to play guitar."

	words1 = word_tokenize(text1)
	pos_tags1 = nltk.pos_tag(words1)

	words2 = word_tokenize(text2)
	from nltk.tokenize import word_tokenize, sent_tokenize

	text = "Hello, Mr. Jacobs. Nice to meet you!"

	sentences = sent_tokenize(text)
	words = word_tokenize(text)

	print (sentences)
	print (words)
	import nltk
	import re
	from nltk.tokenize import word_tokenize
	from nltk.stem import WordNetLemmatizer

	input_file = "./input.txt"
	words_file = "./words.txt"
	output_file = "./output.txt"
	curriculum_words = []
	pos_tagged_array = []
	act \| 0
	be \| 6
	begin \| 0
	believe \| 0
	break \| 0
	call \| 0
	can \| 5
	change \| 0
	choose \| 0
	clean \| 0