ashokc/tf_idf_vectors.py

## tf_idf_vectors.py
# Build Tf-Idf Vectors
from sklearn.feature_extraction.text import TfidfVectorizer
X=np.array([np.array(xi) for xi in X]) # rows:Docs. columns:words
vectorizer = TfidfVectorizer(analyzer=lambda x: x, min_df=1).fit(X)
word_index = vectorizer.vocabulary_
Xencoded = vectorizer.transform(X)
	# Build Tf-Idf Vectors
	from sklearn.feature_extraction.text import TfidfVectorizer
	X=np.array([np.array(xi) for xi in X]) # rows:Docs. columns:words
	vectorizer = TfidfVectorizer(analyzer=lambda x: x, min_df=1).fit(X)
	word_index = vectorizer.vocabulary_
	Xencoded = vectorizer.transform(X)