rafaljanwojcik/assigning_clusters.py

## assigning_clusters.py
words = pd.DataFrame(word_vectors.vocab.keys())
words.columns = ['words']
words['vectors'] = words.words.apply(lambda x: word_vectors.wv[f'{x}'])
words['cluster'] = words.vectors.apply(lambda x: model.predict([np.array(x)]))
words.cluster = words.cluster.apply(lambda x: x[0])
words['cluster_value'] = [1 if i==0 else -1 for i in words.cluster]
words['closeness_score'] = words.apply(lambda x: 1/(model.transform([x.vectors]).min()), axis=1)
words['sentiment_coeff'] = words.closeness_score * words.cluster_value
	words = pd.DataFrame(word_vectors.vocab.keys())
	words.columns = ['words']
	words['vectors'] = words.words.apply(lambda x: word_vectors.wv[f'{x}'])
	words['cluster'] = words.vectors.apply(lambda x: model.predict([np.array(x)]))
	words.cluster = words.cluster.apply(lambda x: x[0])
	words['cluster_value'] = [1 if i==0 else -1 for i in words.cluster]
	words['closeness_score'] = words.apply(lambda x: 1/(model.transform([x.vectors]).min()), axis=1)
	words['sentiment_coeff'] = words.closeness_score * words.cluster_value