Kohya S. kohya-ss

## llm_characters.py
# Apache License 2.0
# 使用法は gist のコメントを見てください
import argparse
import importlib
import json
import os
import random
import time
import traceback
import tomli

## stepwise_linear_decay_lr_scheduler.py
# 仮に logs に入れたら以下のように指定
# --lr_scheduler_type logs.stepwise_linear_decay_lr_scheduler.get_stepwise_linear_decay_lr_scheduler
# --lr_scheduler_args "step_a=50" "step_b=80" "factor_1=1.0" "factor_2=0.1"
#
# step_a までの学習率： 指定した learning_rate * factor_1
# step_a から step_b まで： 線形に減少（増加）
# step_b からの学習率： 指定した learning_rate * factor_2

from torch.optim.lr_scheduler import LambdaLR

## get_wd14_tag_confidence.py
import argparse
import csv
import glob
import os
from pathlib import Path

import cv2
import numpy as np
import torch
from PIL import Image

## make_prompts_with_dartv2.py
# Dart v2を用いて sd-scripts の gen_img.py 用のプロンプトファイルを作成するスクリプト

import random
import torch
from transformers import AutoModelForCausalLM, AutoTokenizer

# Rating tag: <|rating:sfw|>, <|rating:general|>, <|rating:sensitive|>, nsfw, <|rating:questionable|>, <|rating:explicit|>
# Aspect ratio tag: <|aspect_ratio:ultra_wide|>, <|aspect_ratio:wide|>, <|aspect_ratio:square|>, <|aspect_ratio:tall|>, <|aspect_ratio:ultra_tall|>
# Length tag: <|length:very_short|>, <|length:short|>, <|length:medium|>, <|length:long|>, <|length:very_long|>
"""

## gradio_llm.py
# Apache License 2.0
# 使用法は gist のコメントを見てください
import argparse
from typing import List, Optional, Union, Iterator

import llama_cpp
from llama_cpp.llama_chat_format import _convert_completion_to_chat, register_chat_completion_handler
import llama_cpp.llama_types as llama_types
from llama_cpp.llama import LogitsProcessorList, LlamaGrammar
from llama_cpp import Llama, llama_chat_format

## gradio_cmdrp.py
# Apache License 2.0
# 使用法は gist のコメントを見てください

import argparse
from typing import List, Optional, Union, Iterator

from llama_cpp import Llama
from llama_cpp.llama_tokenizer import LlamaHFTokenizer
from llama_cpp.llama_chat_format import _convert_completion_to_chat, register_chat_completion_handler
import llama_cpp.llama_types as llama_types

## sdxl_train_te_leco.py
# sdxl_train_network.py と同じ引数を指定してください
# --network_train_text_encoder_only オプションが必須です
#
# 260行目あたりの src_str, tgt_str に変換元と変換先のテキストを指定してください
# tagger の selected_tags.csv が必要ですので、適宜パスを変更してください
# この辺にあります : https://huggingface.co/SmilingWolf/wd-v1-4-swinv2-tagger-v2/tree/main
#
# "1girl" タグだけは必ず含まれる感じにしているので、必要なら 820 行目あたりを適宜変更してください
#
# 以下のオプションは指定できません（エラーになります）：

## vae_vs_taesd_gradio.py
# Claude 3 Opus とめっちゃやり取りして動くようになった
# python vae_vs_taesd_gradio.py --image_dir /path/to/image/directory

import os
import argparse
import random
from PIL import Image
import torch
from diffusers import AutoencoderKL, AutoencoderTiny
import numpy as np

## vae_vs_taesd.py
# Claude 3 Opus にだいたい書いてもらった
# python vae_vs_taesd.py --image_dir /path/to/image/directory

import os
import argparse
import random
from PIL import Image, ImageTk
import torch
from diffusers import AutoencoderKL, AutoencoderTiny
import tkinter as tk

## fragment_of_sdxl_gen_img.py
        each_control_net_enabled = [self.control_net_enabled] * len(self.control_nets)
        for i, t in enumerate(tqdm(timesteps)):
            # ↓ ここから
            # test: chroma key like composition
            if latents.shape[0] == 4:
                # run this script with batch size 4

                # sample prompt for ANIMAGINE XL V3.0: 2nd prompt doesn't have detailes, because it is used for making mask
                # green surface of green screen --n color, artifact, object, shadow, frame --d 1
                # 1girl, serafuku, standing, cowboy shot, green background, masterpiece, best quality --n nsfw, lowres, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts, signature, watermark, username, blurry, artist name --d 1
	# Apache License 2.0
	# 使用法は gist のコメントを見てください
	import argparse
	import importlib
	import json
	import os
	import random
	import time
	import traceback
	import tomli
	# 仮に logs に入れたら以下のように指定
	# --lr_scheduler_type logs.stepwise_linear_decay_lr_scheduler.get_stepwise_linear_decay_lr_scheduler
	# --lr_scheduler_args "step_a=50" "step_b=80" "factor_1=1.0" "factor_2=0.1"
	#
	# step_a までの学習率：指定した learning_rate * factor_1
	# step_a から step_b まで：線形に減少（増加）
	# step_b からの学習率：指定した learning_rate * factor_2

	from torch.optim.lr_scheduler import LambdaLR
	import argparse
	import csv
	import glob
	import os
	from pathlib import Path

	import cv2
	import numpy as np
	import torch
	from PIL import Image
	# Dart v2を用いて sd-scripts の gen_img.py 用のプロンプトファイルを作成するスクリプト

	import random
	import torch
	from transformers import AutoModelForCausalLM, AutoTokenizer

	# Rating tag: <\|rating:sfw\|>, <\|rating:general\|>, <\|rating:sensitive\|>, nsfw, <\|rating:questionable\|>, <\|rating:explicit\|>
	# Aspect ratio tag: <\|aspect_ratio:ultra_wide\|>, <\|aspect_ratio:wide\|>, <\|aspect_ratio:square\|>, <\|aspect_ratio:tall\|>, <\|aspect_ratio:ultra_tall\|>
	# Length tag: <\|length:very_short\|>, <\|length:short\|>, <\|length:medium\|>, <\|length:long\|>, <\|length:very_long\|>
	"""
	# sdxl_train_network.py と同じ引数を指定してください
	# --network_train_text_encoder_only オプションが必須です
	#
	# 260行目あたりの src_str, tgt_str に変換元と変換先のテキストを指定してください
	# tagger の selected_tags.csv が必要ですので、適宜パスを変更してください
	# この辺にあります : https://huggingface.co/SmilingWolf/wd-v1-4-swinv2-tagger-v2/tree/main
	#
	# "1girl" タグだけは必ず含まれる感じにしているので、必要なら 820 行目あたりを適宜変更してください
	#
	# 以下のオプションは指定できません（エラーになります）：
	# Claude 3 Opus とめっちゃやり取りして動くようになった
	# python vae_vs_taesd_gradio.py --image_dir /path/to/image/directory

	import os
	import argparse
	import random
	from PIL import Image
	import torch
	from diffusers import AutoencoderKL, AutoencoderTiny
	import numpy as np
	# Claude 3 Opus にだいたい書いてもらった
	# python vae_vs_taesd.py --image_dir /path/to/image/directory

	import os
	import argparse
	import random
	from PIL import Image, ImageTk
	import torch
	from diffusers import AutoencoderKL, AutoencoderTiny
	import tkinter as tk
	each_control_net_enabled = [self.control_net_enabled] * len(self.control_nets)
	for i, t in enumerate(tqdm(timesteps)):
	# ↓ ここから
	# test: chroma key like composition
	if latents.shape[0] == 4:
	# run this script with batch size 4

	# sample prompt for ANIMAGINE XL V3.0: 2nd prompt doesn't have detailes, because it is used for making mask
	# green surface of green screen --n color, artifact, object, shadow, frame --d 1
	# 1girl, serafuku, standing, cowboy shot, green background, masterpiece, best quality --n nsfw, lowres, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts, signature, watermark, username, blurry, artist name --d 1