amankharwal/resume screening.py Secret

## resume screening.py
from sklearn.model_selection import train_test_split
from sklearn.feature_extraction.text import TfidfVectorizer
from scipy.sparse import hstack

requiredText = resumeDataSet['cleaned_resume'].values
requiredTarget = resumeDataSet['Category'].values

word_vectorizer = TfidfVectorizer(
    sublinear_tf=True,
    stop_words='english',
    max_features=1500)
word_vectorizer.fit(requiredText)
WordFeatures = word_vectorizer.transform(requiredText)

print ("Feature completed .....")

X_train,X_test,y_train,y_test = train_test_split(WordFeatures,requiredTarget,random_state=0, test_size=0.2)
print(X_train.shape)
print(X_test.shape)
	from sklearn.model_selection import train_test_split
	from sklearn.feature_extraction.text import TfidfVectorizer
	from scipy.sparse import hstack

	requiredText = resumeDataSet['cleaned_resume'].values
	requiredTarget = resumeDataSet['Category'].values

	word_vectorizer = TfidfVectorizer(
	sublinear_tf=True,
	stop_words='english',
	max_features=1500)
	word_vectorizer.fit(requiredText)
	WordFeatures = word_vectorizer.transform(requiredText)

	print ("Feature completed .....")

	X_train,X_test,y_train,y_test = train_test_split(WordFeatures,requiredTarget,random_state=0, test_size=0.2)
	print(X_train.shape)
	print(X_test.shape)