Skip to content

Instantly share code, notes, and snippets.

@Koziev
Koziev / finetune_chitchat_fredt5_with_trainer.py
Created April 26, 2023 05:47
Файнтюн FRED T5 XL via transformers.Trainer
"""
Тренировка модели болталки Axioma на FRED T5 для проекта https://github.com/Koziev/chatbot
Эксперимент с файнтюном: токены истории диалога не включаем в backprop, присваивая соответствующим целям (labels) значение -100
Прочие хинты по тренировке: https://kelijah.livejournal.com/315826.html
"""
import os
import json
import sys
import io
@Koziev
Koziev / run_chitchat_fredt5.py
Last active April 30, 2023 15:53
Интерактивная консольная генерация реплик из модели читчата FRED T5 XL
import os
import argparse
import torch
import transformers
from transformers import T5Config
if __name__ == '__main__':
proj_dir = os.path.expanduser('~/polygon/chatbot')
@Koziev
Koziev / explore_memoization_for_rugpt.py
Created May 22, 2023 08:13
Измерение склонность модели генерации стихов на базе rugpt к воспроизведению обучающих данных
"""
Определение склонности моделей rugpt к запоминанию обучающего датасета
"""
import collections
import os
import json
import itertools
import sys
import argparse
import random
@Koziev
Koziev / explore_memoization_for_fredt5.py
Created May 22, 2023 08:14
Измерение склонности к воспроизведению обучающих данных для модели генерации стихов на базе FRED T5 XL
"""
Определение склонности моделей rugpt к запоминанию обучающего датасета
"""
import collections
import os
import json
import itertools
import sys
import argparse
import random
@Koziev
Koziev / trajectory_explorer.py
Last active January 3, 2024 16:29
Идемпотентность перефразировок через языковые модели, и циклы трансформации
import random
import os
import torch
import transformers
from transformers import AutoModelForSeq2SeqLM, AutoTokenizer
import deepspeed
import matplotlib.pyplot as plt