osori/ngram_analyzer.py

## ngram_analyzer.py
#!/usr/bin/env python3
# -*- coding:utf-8 -*-]

sample_text = "신은 다시 일어서는 법을 가르치기 위해 넘어뜨린다고 나는 믿는다."

def word_ngram(sentence, num_gram):
	ngrams = []
	text = list(sentence) # split the sentence into an array of characters
	ngrams = [text[x:x+num_gram] for x in range(0, len(text))]

	return ngrams

def phoneme_ngram(sentence, num_gram):
	ngrams = []
	text = sentence.split(' ')
	ngrams = [text[x:x+num_gram] for x in range(0, len(text))]
	return ngrams


print(word_ngram(sample_text, 2))
print(phoneme_ngram(sample_text, 3))
	#!/usr/bin/env python3
	# -- coding:utf-8 --]

	sample_text = "신은 다시 일어서는 법을 가르치기 위해 넘어뜨린다고 나는 믿는다."

	def word_ngram(sentence, num_gram):
	ngrams = []
	text = list(sentence) # split the sentence into an array of characters
	ngrams = [text[x:x+num_gram] for x in range(0, len(text))]

	return ngrams

	def phoneme_ngram(sentence, num_gram):
	ngrams = []
	text = sentence.split(' ')
	ngrams = [text[x:x+num_gram] for x in range(0, len(text))]
	return ngrams


	print(word_ngram(sample_text, 2))
	print(phoneme_ngram(sample_text, 3))