kanekomasahiro/split_sentence_to_words.py

## split_sentence_to_words.py
import regex as re


def split_sentence_to_words(sent):
    pat = re.compile(r"'s|'t|'re|'ve|'m|'ll|'d| ?\p{L}+| ?\p{N}+| ?[^\s\p{L}\p{N}]+|\s+(?!\S)|\s+")

    return re.findall(pat, sent)
	import regex as re


	def split_sentence_to_words(sent):
	pat = re.compile(r"'s\|'t\|'re\|'ve\|'m\|'ll\|'d\| ?\p{L}+\| ?\p{N}+\| ?[^\s\p{L}\p{N}]+\|\s+(?!\S)\|\s+")

	return re.findall(pat, sent)