Masahiro Kaneko kanekomasahiro

## calculate_matrix_cosine_similarity_numpy.py
import numpy as np


def calculate_matrix_cosine_similarity(matrix1, matrix2):
    return np.dot(matrix1, matrix2.T) / (np.linalg.norm(matrix1, axis=1) * np.linalg.norm(matrix2, axis=1)).reshape(-1, 1)

## flat_list_of_lists.py
import itertools


def flat_list_of_lists(inputs):
    return itertools.chain.from_iterable(inputs)

## calculate_mean_vector.py
import numpy as np


def calculate_mean_vector(embedding):
    return np.mean(embedding[list(embedding.vocab)], axis=0)

## calculate_vector_cosine_similarity_numpy.py
import numpy as np


def calculate_vector_cosine_similarity(vector1, vector2):
    return np.dot(vector1, vector2) / (np.linalg.norm(vector1) * np.linalg.norm(vector2))

## load_embedding_with_gensim.py
import linecache

from gensim.models import KeyedVectors


def load_embedding_with_gensim(embedding_name):
    '''
    Load embeddings with gensim.
    '''
    if embedding_name.endswith('bin'):

## parser_list.py
import argparse


parser = argparse.ArgumentParser()

args_list = lambda x:list(map(str, x.split(',')))
parser.add_argument('--inputs', type=args_list)

args = parser.parse_args()

## template.py
import argparse


def parse_args():
    parser = argparse.ArgumentParser()

    parser.add_argument('--input', type=str, required=True)

    args = parser.parse_args()

## save_gensim_embedding_from_dict_embedding.py
import gensim
import argparse

import numpy as np


def parse_args():
    parser = argparse.ArgumentParser()
    parser.add_argument('--input', type=str, required=True)
    parser.add_argument('--output', type=str, required=True)

## split_sentence_to_words.py
import regex as re


def split_sentence_to_words(sent):
    pat = re.compile(r"'s|'t|'re|'ve|'m|'ll|'d| ?\p{L}+| ?\p{N}+| ?[^\s\p{L}\p{N}]+|\s+(?!\S)|\s+")

    return re.findall(pat, sent)

## save_word_embedding_text_to_binary.py
import sys
import linecache

from gensim.models import KeyedVectors


def save_word_embedding_text_to_binary(input, output):
    if linecache.getline(input, 1).split() == 2:
        no_header = False
    else:
	import numpy as np


	def calculate_matrix_cosine_similarity(matrix1, matrix2):
	return np.dot(matrix1, matrix2.T) / (np.linalg.norm(matrix1, axis=1) * np.linalg.norm(matrix2, axis=1)).reshape(-1, 1)
	import itertools


	def flat_list_of_lists(inputs):
	return itertools.chain.from_iterable(inputs)
	import numpy as np


	def calculate_mean_vector(embedding):
	return np.mean(embedding[list(embedding.vocab)], axis=0)
	import numpy as np


	def calculate_vector_cosine_similarity(vector1, vector2):
	return np.dot(vector1, vector2) / (np.linalg.norm(vector1) * np.linalg.norm(vector2))
	import linecache

	from gensim.models import KeyedVectors


	def load_embedding_with_gensim(embedding_name):
	'''
	Load embeddings with gensim.
	'''
	if embedding_name.endswith('bin'):
	import argparse


	parser = argparse.ArgumentParser()

	args_list = lambda x:list(map(str, x.split(',')))
	parser.add_argument('--inputs', type=args_list)

	args = parser.parse_args()
	import argparse


	def parse_args():
	parser = argparse.ArgumentParser()

	parser.add_argument('--input', type=str, required=True)

	args = parser.parse_args()
	import gensim
	import argparse

	import numpy as np


	def parse_args():
	parser = argparse.ArgumentParser()
	parser.add_argument('--input', type=str, required=True)
	parser.add_argument('--output', type=str, required=True)
	import regex as re


	def split_sentence_to_words(sent):
	pat = re.compile(r"'s\|'t\|'re\|'ve\|'m\|'ll\|'d\| ?\p{L}+\| ?\p{N}+\| ?[^\s\p{L}\p{N}]+\|\s+(?!\S)\|\s+")

	return re.findall(pat, sent)
	import sys
	import linecache

	from gensim.models import KeyedVectors


	def save_word_embedding_text_to_binary(input, output):
	if linecache.getline(input, 1).split() == 2:
	no_header = False
	else: