abhishek-shrm/eta_on_text_data-16.py

## eta_on_text_data-16.py
# Creating Document Term Matrix
from sklearn.feature_extraction.text
import CountVectorizer
cv=CountVectorizer(analyzer='word')
data=cv.fit_transform(df_grouped['lemmatized'])
df_dtm = pd.DataFrame(data.toarray(), columns=cv.get_feature_names())
df_dtm.index=df_grouped.index
df_dtm.head(3)
	# Creating Document Term Matrix
	from sklearn.feature_extraction.text
	import CountVectorizer
	cv=CountVectorizer(analyzer='word')
	data=cv.fit_transform(df_grouped['lemmatized'])
	df_dtm = pd.DataFrame(data.toarray(), columns=cv.get_feature_names())
	df_dtm.index=df_grouped.index
	df_dtm.head(3)