Skip to content

Instantly share code, notes, and snippets.

View EvilFreelancer's full-sized avatar

Pavel Zloi EvilFreelancer

View GitHub Profile
@EvilFreelancer
EvilFreelancer / results.md
Created January 13, 2025 21:45
Предварительные тесты модели GigaChat 20B-A3B обученной в режиме o1

Почему трава зелёная? (хлорофил)

<Thought> Хорошо, мне нужно объяснить почему трава зеленая. Во-первых, давайте разберемся с основными компонентами фотосинтеза и света. Фотосинтез - это процесс, при котором растения используют свет для преобразования углекислого газа в глюкозу, которая является основным источником энергии для растений. Растения поглощают солнечный свет через хлорофилл, который представляет собой зеленый пигмент, обнаруженный в их клетках. Хлорофиллы имеют тенденцию поглощать синий и красный спектры солнечного излучения более эффективно, чем другие цвета спектра. Однако они также отражают зеленые волны обратно к нашим глазам. Это означает, что мы видим траву как зеленую из-за ее способности отражать преимущественно зеленый цвет. Кроме того, я думаю о том, насколько важен этот аспект для выживания растений. Зеленый цвет помогает им маскироваться среди окружающей среды, а также служит сигналом другим животным или насекомым об источнике пищи. Более того, некоторые виды травы могут иметь р
@EvilFreelancer
EvilFreelancer / peft_lora.txt
Created January 12, 2025 15:52
Qwen2.5 Peft
# peft_model = AutoPeftModelForCausalLM.from_pretrained(output_dir, device_map={"": "cpu"}).to("cpu")
# print(peft_model)
PeftModelForCausalLM(
(base_model): LoraModel(
(model): Qwen2ForCausalLM(
(model): Qwen2Model(
(embed_tokens): Embedding(151665, 3584, padding_idx=151643)
(layers): ModuleList(
(0-27): 28 x Qwen2DecoderLayer(
(self_attn): Qwen2SdpaAttention(
@EvilFreelancer
EvilFreelancer / math-500-en-source.jsonl
Created January 3, 2025 13:38
Сравнение качества перевода через HuggingFaceH4/MATH-500 через utrobinmv/t5_translate_en_ru_zh_large_1024 и qwen2.5:32b
{"problem": "Convert the point $(0,3)$ in rectangular coordinates to polar coordinates. Enter your answer in the form $(r,\\theta),$ where $r > 0$ and $0 \\le \\theta < 2 \\pi.$", "solution": "We have that $r = \\sqrt{0^2 + 3^2} = 3.$ Also, if we draw the line connecting the origin and $(0,3),$ this line makes an angle of $\\frac{\\pi}{2}$ with the positive $x$-axis.\n\n[asy]\nunitsize(0.8 cm);\n\ndraw((-0.5,0)--(3.5,0));\ndraw((0,-0.5)--(0,3.5));\ndraw(arc((0,0),3,0,90),red,Arrow(6));\n\ndot((0,3), red);\nlabel(\"$(0,3)$\", (0,3), W);\ndot((3,0), red);\n[/asy]\n\nTherefore, the polar coordinates are $\\boxed{\\left( 3, \\frac{\\pi}{2} \\right)}.$", "answer": "\\left( 3, \\frac{\\pi}{2} \\right)", "subject": "Precalculus", "level": 2, "unique_id": "test/precalculus/807.json"}
{"problem": "Define\n\\[p = \\sum_{k = 1}^\\infty \\frac{1}{k^2} \\quad \\text{and} \\quad q = \\sum_{k = 1}^\\infty \\frac{1}{k^3}.\\]Find a way to write\n\\[\\sum_{j = 1}^\\infty \\sum_{k = 1}^\\infty \\frac{1}{(j + k)^3}\\]in terms
@EvilFreelancer
EvilFreelancer / qwq-32b-thinking.md
Last active November 28, 2024 12:07
Star Attention - Phase 1: Context Encoding (создано с помощью qwq:32b)

USER

Напиши код на python который бы реализовывал этот алгоритм:

Algorithm 1 Star Attention - Phase 1: Context Encoding
1:Context c, Block size b
2:L←length⁢(c)
3:Split c into n=⌈L/b⌉ blocks, such that c=\[c1,c2,…,cn\] ▷ Each block has upto b tokens
4:for i=2 to n do
5: ci′←(c1,ci) ▷ Each block ci is prefixed with anchor block c1
@EvilFreelancer
EvilFreelancer / save_markdown.py
Last active November 23, 2024 12:17
Сохранение HTML страниц из интернета в Markdown через Firefox и Selenium
import os
import os.path
import urllib.parse
import zipfile
import datetime
from selenium import webdriver
from selenium.webdriver.firefox.service import Service as FirefoxService
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
@EvilFreelancer
EvilFreelancer / manticore_search_rag_on_snippets_call.py
Last active November 16, 2024 11:57
Пример базы знаний для RAG-like проекта который использует ManticoreSearch SNIPPETS CALL и выдачу из DuckDuckGo
import os
import time
import re
import requests
import hashlib
import mysql.connector
from duckduckgo_search import DDGS
from concurrent.futures import ThreadPoolExecutor
class HtmlExtractor:
@EvilFreelancer
EvilFreelancer / ollama-docker.md
Last active October 19, 2024 12:43
Алгоритм переключения ollama с системы на Docker-контейнер

Деинсталяция ollama

Для начала выполним остановку сервиса ollama и удалим конфирацию:

sudo systemctl stop ollama
sudo systemctl disable ollama
sudo rm /etc/systemd/system/ollama.service
@EvilFreelancer
EvilFreelancer / translator.py
Last active December 30, 2024 22:10
Перевод датасета на русский при помощи utrobinmv/t5_translate_en_ru_zh_small_1024
# See https://github.com/EvilFreelancer/datasets-translator
import torch
import json
from transformers import T5ForConditionalGeneration, T5Tokenizer, BitsAndBytesConfig
from tqdm import tqdm
from bs4 import BeautifulSoup, NavigableString
# Quantization related settings
@EvilFreelancer
EvilFreelancer / convert_xl_to_gpt2.py
Created September 26, 2024 06:54
Пример скрипта конвертации ruGPT3XL в формат совместимый с Transformers
import os
import torch
from transformers import GPT2LMHeadModel, GPT2Config, GPT2Tokenizer, pipeline
if not os.path.exists("ru_gpts"):
raise Exception(
"Folder `ru_gpts` not found! Please run `git clone https://github.com/EvilFreelancer/ru-gpts.git ru_gpts` first")
from ru_gpts.src.xl_wrapper import RuGPT3XL
import requests
import json
import timeit
start = timeit.default_timer()
prompt = "С какой периодичностью происходит ледниковый период"
result = requests.post('http://localhost:11434/api/generate', json={'model': "llama3.1:70b", "options":{ "seed": 123,"num_predict":500,"temperature": 0,"num_ctx": 4000}, "keep_alive":"10m", "prompt":prompt, "stream": False}).content
a = json.loads(result)
print( a['response'])
print("Всего токенов: ",a['eval_count'])