Skip to content

Instantly share code, notes, and snippets.

View oserikov's full-sized avatar
🐈
meow

Oleg Serikov oserikov

🐈
meow
View GitHub Profile
@oserikov
oserikov / commands.out
Created May 21, 2022 04:49
here, two VerbBases (ur, or) are meant to behave identically, yet lead to different inference results on the respective versions of the same string (urrin, orrin))
main@standard 22 23
Reading input from eve.twol.
Writing output to eve.twol.hfst.
Reading alphabet.
Reading sets.
Reading rules and compiling their contexts and centers.
Compiling rules.
Storing rules.
hfst-lookup: warning: It is not possible to perform fast lookups with OpenFST, std arc, tropical semiring format automata.
Using HFST basic transducer format and performing slow lookups

python 27 января 2020

Задача о неудачах на прошлогоднем экзамене.

Дедлайн ~ 10.0-10.10, потом обсудим.

Есть дамп (csv, >2Гб на флешке и тут) комментов к постам Лентача за какое-то большое время. Сделайте с ним что-то.

e.g. найдите всех, кого назыали кремлеботами.

  • есть ли кто-то, кого так называют постоянно?

python 27 января 2020

Задача для разогрева

Дедлайн ~ 9.20-9.30, потом обсудим.

  1. Составить частотный словарь ЛЕММАТИЗИРОВАННОГО (ссылки ниже) дампа газеты "Полярный круг" (в лоб, всякие улучшения стоит пробовать только после первых двух этапов задачки).
    i.e. для каждого слова посчитать, сколько раз оно встретилось в дампе.
  2. Если получилось, научиться его как-то сохранять читаемым и отсортированным по убыванию частоты
  3. Если получилось, почистить как-то словарь от лишнего
  4. Если получилось, сравнить распределение частот слов среди заголовков статей и текстов статей (хз, есть ли там что-то прикольное, надо посмотреть :))

@oserikov
oserikov / DL20012020links.md
Last active January 20, 2020 05:01
Цг 20 января ссылки
@oserikov
oserikov / python-20-2020.ipynb
Last active January 20, 2020 03:35
python 20 янв 2020.ipynb
Sorry, something went wrong. Reload?
Sorry, we cannot display this file.
Sorry, this file is invalid so it cannot be displayed.
@oserikov
oserikov / python-20-2020.ipynb
Last active January 20, 2020 04:17
python 20 янв 2020.ipynb
Sorry, something went wrong. Reload?
Sorry, we cannot display this file.
Sorry, this file is invalid so it cannot be displayed.

Случайная памятка о текстовых файлах, командной строке и python.

для windows и mac os

В заметке приведены инструкции. Если они не срабатывают или вы не уверены в том, что они срабатывают, смело пишите преподу или ассистенту. Я (Олег) быстрее всего отвечаю на телеграм. Там я @oserikov


@oserikov
oserikov / pytorch041_cuda92_colab.sh
Last active February 26, 2019 15:26 — forked from Con-Mi/pytorch041_cuda92_colab.sh
A shell file to install CUDA 9.2 backend for PyTorch 0.4.1 on Google Colab.
#!/bin/bash
TEXT_RESET='\e[0m'
TEXT_YELLOW='\e[1;33m'
wget https://developer.nvidia.com/compute/cuda/9.2/Prod2/local_installers/cuda-repo-ubuntu1604-9-2-local_9.2.148-1_amd64
echo -e $TEXT_YELLOW
echo 'WEBGET finished..'
echo -e $TEXT_RESET