Jirayut Keawchuen Jirayut558

## gist:7a62761c374b2fa00043d73ebaca237e
def test_model():
    # define model

    train, infenc, infdec = ende_embedding_model(n_in, n_out, 256)
    # load weights
    infenc.load_weights("model/model_enc.h5")
    infdec.load_weights("model/model_dec.h5")

    # start prediction
    while True:

## gist:bac5e3093ec90eddc60367b034606202
def train():
    data = "corpus.th.csv"
    dataX = []
    dataY = []
    X1 = []
    X2 = []
    Y = []
    vecsize = encoded_length

    dataX,dataY = load_csv_data(data)

## gist:e4a7c833a394f1b8f95e28c38165230a
def embedding_model():
    # define word embedding
    vocab_list = [(k, wv_model.wv[k]) for k, v in wv_model.wv.vocab.items()]
    embeddings_matrix = np.zeros((len(wv_model.wv.vocab.items()) + 1, wv_model.vector_size))
    for i in range(len(vocab_list)):
        word = vocab_list[i][0]
        embeddings_matrix[i + 1] = vocab_list[i][1]

    embedding_layer = Embedding(input_dim=len(embeddings_matrix),
                                output_dim=EMBEDDING_DIM,

## gist:b8b6e29262270a3083a68f5bff297c6b
def word_index(listword):
    dataset = []
    for sentence in listword:
        tmp = []
        for w in sentence:
            tmp.append(word2idx(w))
        dataset.append(tmp)
    return np.array(dataset)

def word2idx(word):

## gist:5edd2cb406e132986bc13e23ce48b427
X1 = word_index(X1)
X2 = word_index(X2)
Y = word_index(Y)
Y = to_categorical(Y, num_classes=max_word+1)

## gist:2ecf1b98cd755ca2fcc5f71d6bc026ef
def padding_sequence(listsentence,maxseq):
    dataset = []
    for s in listsentence:
        n = maxseq - len(s)
        if n>0:
            dataset.append(s+(["<EOS>"]*n))
        elif n<0:
            dataset.append(s[0:maxseq])
        else:
            dataset.append(s)

## gist:268165fc0e3ca40ca2219759172330a8
def preparingword(listword):
    word =[]
    for w in listword:
        word.append(wordcut(w))
    return word
def wordcut(sentence):
    return deepcut.tokenize(sentence)

## gist:79bc5fa92f5d089610888e9ee6689679
def load_data(datafile):
    dataX = []
    dataY = []
    data = open(datafile, "r").read().lower()
    for i in data.split("\n\n"):
        a = i.split("\n")
        question = a[0]
        answer = a[1]
        dataX.append(question)
        dataY.append(answer)

## gist:2f6c39d8d899a12213a871550e5372a0
def load_data(datafile):
    dataX = []
    dataY = []
    data = open(datafile, "r").read().lower()
    for i in data.split("\n\n"):
        a = i.split("\n")
        question = a[0]
        answer = a[1]
        dataX.append(question)
        dataY.append(answer)

## gist:48b50d2b7f349d95deeba4b41cebd7c8
# -*- coding: utf-8 -*-
import logging
import os.path
import sys
import multiprocessing
from gensim.corpora import WikiCorpus
from gensim.models import Word2Vec
from gensim.models.word2vec import LineSentence

if __name__ == '__main__':
	def test_model():
	# define model

	train, infenc, infdec = ende_embedding_model(n_in, n_out, 256)
	# load weights
	infenc.load_weights("model/model_enc.h5")
	infdec.load_weights("model/model_dec.h5")

	# start prediction
	while True:
	def train():
	data = "corpus.th.csv"
	dataX = []
	dataY = []
	X1 = []
	X2 = []
	Y = []
	vecsize = encoded_length

	dataX,dataY = load_csv_data(data)
	def embedding_model():
	# define word embedding
	vocab_list = [(k, wv_model.wv[k]) for k, v in wv_model.wv.vocab.items()]
	embeddings_matrix = np.zeros((len(wv_model.wv.vocab.items()) + 1, wv_model.vector_size))
	for i in range(len(vocab_list)):
	word = vocab_list[i][0]
	embeddings_matrix[i + 1] = vocab_list[i][1]

	embedding_layer = Embedding(input_dim=len(embeddings_matrix),
	output_dim=EMBEDDING_DIM,
	def word_index(listword):
	dataset = []
	for sentence in listword:
	tmp = []
	for w in sentence:
	tmp.append(word2idx(w))
	dataset.append(tmp)
	return np.array(dataset)

	def word2idx(word):
	X1 = word_index(X1)
	X2 = word_index(X2)
	Y = word_index(Y)
	Y = to_categorical(Y, num_classes=max_word+1)
	def padding_sequence(listsentence,maxseq):
	dataset = []
	for s in listsentence:
	n = maxseq - len(s)
	if n>0:
	dataset.append(s+(["<EOS>"]*n))
	elif n<0:
	dataset.append(s[0:maxseq])
	else:
	dataset.append(s)
	def preparingword(listword):
	word =[]
	for w in listword:
	word.append(wordcut(w))
	return word
	def wordcut(sentence):
	return deepcut.tokenize(sentence)
	def load_data(datafile):
	dataX = []
	dataY = []
	data = open(datafile, "r").read().lower()
	for i in data.split("\n\n"):
	a = i.split("\n")
	question = a[0]
	answer = a[1]
	dataX.append(question)
	dataY.append(answer)
	# -- coding: utf-8 --
	import logging
	import os.path
	import sys
	import multiprocessing
	from gensim.corpora import WikiCorpus
	from gensim.models import Word2Vec
	from gensim.models.word2vec import LineSentence

	if __name__ == '__main__':