do-me/semantic_text_splitter_pandarallel.py

## semantic_text_splitter_pandarallel.py
from semantic_text_splitter import TextSplitter
from pandarallel import pandarallel

pandarallel.initialize(progress_bar=True)

splitter = TextSplitter((1500,2000)) # equals around 512 tokens embedding model context, referring to chars here

def wrap_func(text):
    return splitter.chunks(text)
df["chunks"] = df["text"].parallel_apply(wrap_func)
	from semantic_text_splitter import TextSplitter
	from pandarallel import pandarallel

	pandarallel.initialize(progress_bar=True)

	splitter = TextSplitter((1500,2000)) # equals around 512 tokens embedding model context, referring to chars here

	def wrap_func(text):
	return splitter.chunks(text)
	df["chunks"] = df["text"].parallel_apply(wrap_func)