pgolding/cosine_similarity.py

## cosine_similarity.py
# http://scikit-learn.org/stable/modules/generated/sklearn.metrics.pairwise.cosine_similarity.html
import numpy as np
from sklearn.metrics.pairwise import cosine_similarity

# The usual creation of arrays produces wrong format (as cosine_similarity works on matrices)
x = np.array([2,3,1,0])
y = np.array([2,3,0,0])

# Need to reshape these
x = x.reshape(1,-1)
y = y.reshape(1,-1)

# Or just create as a single row matrix
z = np.array([[1,1,1,1]])

# Now we can compute similarities
cosine_similarity(x,y) # = array([[ 0.96362411]]), most similar
cosine_similarity(x,z) # = array([[ 0.80178373]]), next most similar
cosine_similarity(y,z) # = array([[ 0.69337525]]), least similar
	# http://scikit-learn.org/stable/modules/generated/sklearn.metrics.pairwise.cosine_similarity.html
	import numpy as np
	from sklearn.metrics.pairwise import cosine_similarity

	# The usual creation of arrays produces wrong format (as cosine_similarity works on matrices)
	x = np.array([2,3,1,0])
	y = np.array([2,3,0,0])

	# Need to reshape these
	x = x.reshape(1,-1)
	y = y.reshape(1,-1)

	# Or just create as a single row matrix
	z = np.array([[1,1,1,1]])

	# Now we can compute similarities
	cosine_similarity(x,y) # = array([[ 0.96362411]]), most similar
	cosine_similarity(x,z) # = array([[ 0.80178373]]), next most similar
	cosine_similarity(y,z) # = array([[ 0.69337525]]), least similar