arshjat/1.7.py

## 1.7.py
tk = Tokenizer(lower = True, filters='')
tk.fit_on_texts(full_text)

train_tokenized = tk.texts_to_sequences(train['tweet'])
test_tokenized = tk.texts_to_sequences(test['tweet'])

max_len = 50
X_train = pad_sequences(train_tokenized, maxlen = max_len)
X_test = pad_sequences(test_tokenized, maxlen = max_len)
	tk = Tokenizer(lower = True, filters='')
	tk.fit_on_texts(full_text)

	train_tokenized = tk.texts_to_sequences(train['tweet'])
	test_tokenized = tk.texts_to_sequences(test['tweet'])

	max_len = 50
	X_train = pad_sequences(train_tokenized, maxlen = max_len)
	X_test = pad_sequences(test_tokenized, maxlen = max_len)