robert-mcdermott/ollama-doc-qa.py

## ollama-doc-qa.py
# pip install chromadb==0.4.15 # need to pin to this version for current langchain version
from langchain.llms import Ollama
from langchain.document_loaders import WebBaseLoader
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain.embeddings import GPT4AllEmbeddings
from langchain.vectorstores import Chroma
from langchain.chains import RetrievalQA

ollama = Ollama(base_url='http://localhost:11434', model='zephyr:latest')

loader = WebBaseLoader('https://en.wikipedia.org/wiki/Fred_Hutchinson_Cancer_Center')
data = loader.load()

text_splitter = RecursiveCharacterTextSplitter(chunk_size=500, chunk_overlap=0)
all_splits = text_splitter.split_documents(data)

vectorstore = Chroma.from_documents(documents=all_splits, embedding=GPT4AllEmbeddings())

qachain = RetrievalQA.from_chain_type(ollama, retriever=vectorstore.as_retriever())

question = "Who are the notable faculty?"
print(qachain({"query": question}))
	# pip install chromadb==0.4.15 # need to pin to this version for current langchain version
	from langchain.llms import Ollama
	from langchain.document_loaders import WebBaseLoader
	from langchain.text_splitter import RecursiveCharacterTextSplitter
	from langchain.embeddings import GPT4AllEmbeddings
	from langchain.vectorstores import Chroma
	from langchain.chains import RetrievalQA

	ollama = Ollama(base_url='http://localhost:11434', model='zephyr:latest')

	loader = WebBaseLoader('https://en.wikipedia.org/wiki/Fred_Hutchinson_Cancer_Center')
	data = loader.load()

	text_splitter = RecursiveCharacterTextSplitter(chunk_size=500, chunk_overlap=0)
	all_splits = text_splitter.split_documents(data)

	vectorstore = Chroma.from_documents(documents=all_splits, embedding=GPT4AllEmbeddings())

	qachain = RetrievalQA.from_chain_type(ollama, retriever=vectorstore.as_retriever())

	question = "Who are the notable faculty?"
	print(qachain({"query": question}))