Created
May 19, 2024 08:37
-
-
Save youngkiu/4ae0edcfb85eff0df022a3e5ef9b3c40 to your computer and use it in GitHub Desktop.
네이버 맛집 블로그에서 openai를 통해 상호명, 주소, 썸네일 추출 시도
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
import os | |
from dotenv import load_dotenv | |
from langchain_community.document_loaders import WebBaseLoader | |
from langchain_core.prompts import PromptTemplate | |
from langchain_core.output_parsers import StrOutputParser | |
from langchain_openai import ChatOpenAI | |
load_dotenv() | |
loader = WebBaseLoader("https://blog.naver.com/begopa1092/223435916689") | |
docs = loader.load() | |
prompt_template = PromptTemplate.from_template( | |
""" | |
다음의 블로그는 음식점 상호와 각종 사진으로 그 음식점에 대한 설명이 있습니다. | |
상호명은 보통 블로그 제목에 있으며, 네이버지도를 포함하는 경우가 많고, 해외의 경우 구글지도를 포함합니다. | |
1. 블로그에서 설명하고 있는 음식점 명을 알려줘 | |
2. 블로그에서 설명하고 있는 음식점 주소를 알려줘 | |
3. 블로그에서 설명에 사용하고 있는 여러 사진중 대표적인 음식 사진의 URL을 알려줘 | |
--- | |
블로그: {Blog} | |
""" | |
) | |
llm = ChatOpenAI( | |
temperature=0, | |
model_name="gpt-3.5-turbo-16k-0613", | |
openai_api_key=os.environ["OPENAI_API_KEY"] | |
) | |
chain = prompt_template | llm | StrOutputParser() | |
result = chain.invoke({"Blog": docs}) | |
print(result) | |
# 1. 블로그에서 설명하고 있는 음식점 명은 "Bittersweet Memories"입니다. | |
# | |
# 2. 블로그에서 설명하고 있는 음식점 주소는 블로그 내에 제공되지 않았습니다. | |
# | |
# 3. 대표적인 음식 사진의 URL은 블로그 내에 제공되지 않았습니다. |
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment