Skip to content

Instantly share code, notes, and snippets.

@youngkiu
Created May 19, 2024 08:37
Show Gist options
  • Save youngkiu/4ae0edcfb85eff0df022a3e5ef9b3c40 to your computer and use it in GitHub Desktop.
Save youngkiu/4ae0edcfb85eff0df022a3e5ef9b3c40 to your computer and use it in GitHub Desktop.
네이버 맛집 블로그에서 openai를 통해 상호명, 주소, 썸네일 추출 시도
import os
from dotenv import load_dotenv
from langchain_community.document_loaders import WebBaseLoader
from langchain_core.prompts import PromptTemplate
from langchain_core.output_parsers import StrOutputParser
from langchain_openai import ChatOpenAI
load_dotenv()
loader = WebBaseLoader("https://blog.naver.com/begopa1092/223435916689")
docs = loader.load()
prompt_template = PromptTemplate.from_template(
"""
다음의 블로그는 음식점 상호와 각종 사진으로 그 음식점에 대한 설명이 있습니다.
상호명은 보통 블로그 제목에 있으며, 네이버지도를 포함하는 경우가 많고, 해외의 경우 구글지도를 포함합니다.
1. 블로그에서 설명하고 있는 음식점 명을 알려줘
2. 블로그에서 설명하고 있는 음식점 주소를 알려줘
3. 블로그에서 설명에 사용하고 있는 여러 사진중 대표적인 음식 사진의 URL을 알려줘
---
블로그: {Blog}
"""
)
llm = ChatOpenAI(
temperature=0,
model_name="gpt-3.5-turbo-16k-0613",
openai_api_key=os.environ["OPENAI_API_KEY"]
)
chain = prompt_template | llm | StrOutputParser()
result = chain.invoke({"Blog": docs})
print(result)
# 1. 블로그에서 설명하고 있는 음식점 명은 "Bittersweet Memories"입니다.
#
# 2. 블로그에서 설명하고 있는 음식점 주소는 블로그 내에 제공되지 않았습니다.
#
# 3. 대표적인 음식 사진의 URL은 블로그 내에 제공되지 않았습니다.
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment