dimazest/similarity.py

## similarity.py
import pandas as pd

from gensim.models.word2vec import Word2Vec


words = pd.read_csv('wordsim.txt', header=None, names=('word1', 'word2', 'phonetic similarity'))
model = Word2Vec.load_word2vec_format('/GoogleNews-vectors-negative300.bin', binary=True)

def similarity(r):
    try:
        return model.similarity(r['word1'], r['word2'])
    except KeyError:
        pass

words['semantic similarity'] = words.apply(
    similarity,
    axis=1
)

words.to_csv('wordsim-semantic.txt', index=False)
	import pandas as pd

	from gensim.models.word2vec import Word2Vec


	words = pd.read_csv('wordsim.txt', header=None, names=('word1', 'word2', 'phonetic similarity'))
	model = Word2Vec.load_word2vec_format('/GoogleNews-vectors-negative300.bin', binary=True)

	def similarity(r):
	try:
	return model.similarity(r['word1'], r['word2'])
	except KeyError:
	pass

	words['semantic similarity'] = words.apply(
	similarity,
	axis=1
	)

	words.to_csv('wordsim-semantic.txt', index=False)