Skip to content

Instantly share code, notes, and snippets.

@Koziev
Koziev / gist:50a1950c9e2bb0ac7ddb6b3d62bcf4b4
Created Dec 8, 2017
согласование глагола и подлежащего что/кто
View gist:50a1950c9e2bb0ac7ddb6b3d62bcf4b4
... код поскипан ...
static string RebuildVerb2(SolarixGrammarEngineNET.GrammarEngine2 gren, SolarixGrammarEngineNET.SyntaxTreeNode v_node, string qword)
{
if( string.IsNullOrEmpty(qword))
{
return null;
}
List<int> coords = new List<int>();
@Koziev
Koziev / answering_machine.py
Created Jan 5, 2018
Черновик прототипа retrieval-based чат-бота
View answering_machine.py
# -*- coding: utf-8 -*-
'''
Ответчик.
Использует все ранее обученные скриптами relevancy_model и qa_model модели
и выполняет следующие действия:
1) с консоли вводится вопрос.
2) ищется наиболее подходящая предпосылка из списка, загружаемого из текстового файла.
3) определяется способ конструирования ответа - yes/no или word copy.
4) ответ генерируется и печатается.
'''
@Koziev
Koziev / existing_adverbial_participles_and_infinitives.tsv
Created Apr 11, 2018
Классификатор на базе XGBoost для генерации форм деепричастия из инфинтивных форм
View existing_adverbial_participles_and_infinitives.tsv
We can make this file beautiful and searchable if this error is corrected: No tabs found in this TSV file in line 0.
# -*- coding: utf-8 -*-
"""
Генерация словарных статей для деепричастий по статьям инфинитивов.
"""
from __future__ import division # for python2 compatability
from __future__ import print_function
import codecs
import collections
@Koziev
Koziev / gist:8a7dce5c998511d6223de32fe4b248bd
Created Jul 15, 2018
Сортировка списка предложений через LSA и t-SNE
View gist:8a7dce5c998511d6223de32fe4b248bd
# -*- coding: utf-8 -*-
'''
Сортировка списка предложений через последовательное применение LSA и t-SNE (встраивание
векторов LSA в 1d)
'''
from __future__ import division # for python2 compatability
from __future__ import print_function
import codecs
@Koziev
Koziev / w2v.py
Created Sep 28, 2018
Генерация файла w2v.CBOW=1_WIN=5_DIM=32.bin, используемого в чатботе
View w2v.py
# -*- coding: utf-8 -*-
'''
Генерация word2vector моделей для слов.
Используется готовый корпус, в котором каждое слово отделено пробелами, и каждое
предложение находится на отдельной строке.
'''
from __future__ import print_function
from gensim.models import word2vec
import logging
@Koziev
Koziev / Program.cs
Created Oct 25, 2018
Тест библиотеки NNSharp: тренировка Keras-модели в питоне, загрузка и использование в C#
View Program.cs
using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using System.Threading.Tasks;
using NNSharp.DataTypes;
namespace sample1
{
class Program
@Koziev
Koziev / Program.cs
Last active Oct 25, 2018
Проверка либы NNSharp: использование в .NET моделей, обученных в Python+Keras
View Program.cs
using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using System.Threading.Tasks;
using NNSharp.DataTypes;
namespace sample1
{
class Program
View linreg2(autograd).py
# -*- coding: utf-8 -*-
"""
Использование автоматического дифференцирования autograd (https://github.com/HIPS/autograd)
для решения линейной регрессии МНК.
Код может решать только задачу линейно регрессии, так как
в нем отдельно выписывается градиентный спуск по каждому из двух
компонентов решения через частные производные.
"""
View linreg3(autograd).py
# -*- coding: utf-8 -*-
"""
Использование автоматического дифференцирования autograd (https://github.com/HIPS/autograd)
для решения линейной регрессии МНК.
"""
from __future__ import print_function
import autograd.numpy as np
View linreg(keras).py
# -*- coding: utf-8 -*-
"""
Решение задачи линейно регрессии по МНК с помощью Keras.
"""
from __future__ import print_function
import random
import numpy as np