aravindpai/texttokenizer.py

## texttokenizer.py
#prepare a tokenizer for reviews on training data
x_tokenizer = Tokenizer()
x_tokenizer.fit_on_texts(list(x_tr))

#convert text sequences into integer sequences
x_tr    =   x_tokenizer.texts_to_sequences(x_tr)
x_val   =   x_tokenizer.texts_to_sequences(x_val)

#padding zero upto maximum length
x_tr    =   pad_sequences(x_tr,  maxlen=max_len_text, padding='post')
x_val   =   pad_sequences(x_val, maxlen=max_len_text, padding='post')

x_voc_size   =  len(x_tokenizer.word_index) +1
	#prepare a tokenizer for reviews on training data
	x_tokenizer = Tokenizer()
	x_tokenizer.fit_on_texts(list(x_tr))

	#convert text sequences into integer sequences
	x_tr = x_tokenizer.texts_to_sequences(x_tr)
	x_val = x_tokenizer.texts_to_sequences(x_val)

	#padding zero upto maximum length
	x_tr = pad_sequences(x_tr, maxlen=max_len_text, padding='post')
	x_val = pad_sequences(x_val, maxlen=max_len_text, padding='post')

	x_voc_size = len(x_tokenizer.word_index) +1