ftnext/openai_text_embedding_3_ja.py

## openai_text_embedding_3_ja.py
# Based on https://gist.github.com/ftnext/b0f4db8dc71333f7b663c4f5da9ec16f
import numpy as np
from openai import OpenAI

client = OpenAI()


def get_embedding(text, model):
    response = client.embeddings.create(input=text, model=model)  # dimensions=256
    embedding = response.data[0].embedding
    return np.array(embedding)


sentences = [
    "好きな食べ物は何ですか？",
    "どこにお住まいですか？",
    "朝の電車は混みますね",
    "今日は良いお天気ですね",
    "最近景気悪いですね",
]

model_name = "text-embedding-3-small"
# model_name = "text-embedding-3-large"
embeddings = []
for sentence in sentences:
    embeddings.append(get_embedding(sentence, model_name))
embeddings = np.array(embeddings)

sentence = "今日は雨降らなくてよかった"
# sentence = "ハンバーガーは好きですか？"
embedding = get_embedding(sentence, model_name)

scores = np.dot(embedding, embeddings.T)
print("文:", sentence)
print("類似文:", sentences[np.argmax(scores)])
print("類似度:", scores)
	# Based on https://gist.github.com/ftnext/b0f4db8dc71333f7b663c4f5da9ec16f
	import numpy as np
	from openai import OpenAI

	client = OpenAI()


	def get_embedding(text, model):
	response = client.embeddings.create(input=text, model=model) # dimensions=256
	embedding = response.data[0].embedding
	return np.array(embedding)


	sentences = [
	"好きな食べ物は何ですか？",
	"どこにお住まいですか？",
	"朝の電車は混みますね",
	"今日は良いお天気ですね",
	"最近景気悪いですね",
	]

	model_name = "text-embedding-3-small"
	# model_name = "text-embedding-3-large"
	embeddings = []
	for sentence in sentences:
	embeddings.append(get_embedding(sentence, model_name))
	embeddings = np.array(embeddings)

	sentence = "今日は雨降らなくてよかった"
	# sentence = "ハンバーガーは好きですか？"
	embedding = get_embedding(sentence, model_name)

	scores = np.dot(embedding, embeddings.T)
	print("文:", sentence)
	print("類似文:", sentences[np.argmax(scores)])
	print("類似度:", scores)