AyishaR/question_tokenization.py

## question_tokenization.py
# Tokenization
vocab = 1500
mlen = 200

tokenizer = Tokenizer(num_words = vocab, oov_token = '<UNK>')
tokenizer.fit_on_texts(Xtrain)

Xtrain = tokenizer.texts_to_sequences(Xtrain)
Xtrain = pad_sequences(Xtrain, maxlen=mlen)

Xval = tokenizer.texts_to_sequences(Xval)
Xval = pad_sequences(Xval, maxlen=mlen)
	# Tokenization
	vocab = 1500
	mlen = 200

	tokenizer = Tokenizer(num_words = vocab, oov_token = '<UNK>')
	tokenizer.fit_on_texts(Xtrain)

	Xtrain = tokenizer.texts_to_sequences(Xtrain)
	Xtrain = pad_sequences(Xtrain, maxlen=mlen)

	Xval = tokenizer.texts_to_sequences(Xval)
	Xval = pad_sequences(Xval, maxlen=mlen)