Demo běželo na běžné herní GPU, konkrétně GTX 1080. Software by měl jít bez problémů nainstalovat na jakoukoli Nvidia GPU s dostatečnou pamětí (aspoň 4GB, spíš 6GB, u 4GB povypínejte ostatní věci). Lze to zprovoznit i na AMD GPU, ale je to komplikovanější.
Generátor obrázků je neuronová síť založená na Stable Diffusion v1.5. Grafické rozhranní (klikátko je web UI od Automatic1111. Pro účely AnimeFestu jsem rozhraní upravil, a všechny úpravy jsou v mém forku: https://github.com/racinmat/stable-diffusion-webui Tento fork primárně umožňuje schovat většinu UI, aby to bylo jednodušší pro návštěvníky. Pokud si chcete generovat doma a hrát si s nastavením, doporučuji původní repo: https://github.com/AUTOMATIC1111/stable-diffusion-webui.
Pokud chcete použít můj fork, postupujte podle návodu na instalaci z https://github.com/AUTOMATIC1111/stable-diffusion-webui#installation-and-running, ale místo git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git
použijte git clone https://github.com/racinmat/stable-diffusion-webui.git
Pokud chcete použít můj fork, ale mít přístupné i jiné taby (např. Settings apod.), upravte řádek https://github.com/racinmat/stable-diffusion-webui/blob/master/config-af.json#L115 a odeberte všechny taby, které chcete vidět.
Použitý model: Kenshi 01, pruned, f16
- https://huggingface.co/SweetLuna/Kenshi/blob/main/KENSHI%2001/KENSHI01_Pruned_f16.safetensors
- https://civitai.com/models/3850
Použitý variační autoencoder (VAE): kl-f8-anime2
- https://huggingface.co/hakurei/waifu-diffusion-v1-4/blob/main/vae/kl-f8-anime2.ckpt
- https://civitai.com/models/23906/kl-f8-anime2-vae
Návod na spuštění a technické požadavky: viz readme v repu https://github.com/AUTOMATIC1111/stable-diffusion-webui
Jeden z mnoha návodů na zprovoznění: https://stable-diffusion-art.com/install-windows/
AUTOMATIC1111/stable-diffusion-webui má poměrně rozsáhlou wiki se spoustou návodů: https://github.com/AUTOMATIC1111/stable-diffusion-webui/wiki
Do stable diffusion web ui existuje mnoho extensions, za zmínku stojí např. kontrola pózy na obrázku https://github.com/AUTOMATIC1111/stable-diffusion-webui/wiki/Extensions#openpose-editor nebo např. výše zmíněný diffusion defender https://github.com/AUTOMATIC1111/stable-diffusion-webui/wiki/Extensions#diffusion-defender
Přednáška o AI a zdroje na letošním AF:
Oproti původnímu repu je u mnoha tlačítek přidán label, aby byly v konfiguráku. U většiny UI prvků je nastaveno, aby byly skryté, abychom měli jednodušší UI pro běžné uživatele. Původní repo má plné UI. Puštění mého forku s původními konfiguráky je možné po nastavení:
set COMMANDLINE_ARGS=--theme dark --ui-settings-file=config.json --ui-config-file=ui-config-default.json
v webui-user.bat
.
Většina skrytých parametrů je nastavená na rozumné defaultní hodnoty.
Je tam doinstalována extensiona https://github.com/WildBanjos/DiffusionDefender, konkrétně můj fork https://github.com/racinmat/DiffusionDefender, s vlastním blacklistem, aby během festivalo nebylo snadné generovat porno. Je tam také schován a zahardcoděn negative prompt komplikující generování porna. Není problém doma pustit stable diffusion s jiným negative promptem a nebo extension/s prázdným blacklistem v extension, a generovat si doma porno.
Web UI umožňuje používat mnoho modelů a přepínat mezi nimi, modely můžete najít na těchto webech, kde jsou zdarma volně dostupné:
odkud stahnete model, dáte do příslušné složky, a ve Web UI půjde načíst.
Při spuštění se stahuje pytorch_model.bin, co má cca 1.7GB, viz AUTOMATIC1111/stable-diffusion-webui#9182, dá se stahnout předem z https://huggingface.co/openai/clip-vit-large-patch14/tree/main
- Základní guide: https://rentry.org/voldy
- Schizo negative: https://rentry.org/SchizoNegative
- Supreme schizo negative (není tak schizo, ale název se ujal): https://rentry.org/schizoneg
- Reozcestník na články z 4chan /hdg/: https://rentry.org/hdg-collab-master
- /hdg/ Prompt assist: https://rentry.org/hdgpromptassist
- lora training: https://rentry.org/lora_train
- lora repo: https://rentry.org/hdglorarepo
- nai prior v2: https://rentry.org/nai-prior-v2
- stable diffusion vs automatic1111: https://rentry.org/sd-issues
- berry mix guide: https://rentry.org/berrymix
- stable diffusion models: https://rentry.org/sdmodels
- velký článek o generování obrázků: https://rentry.org/animusmixed
- embedded training pro postavy: https://rentry.org/simplified-embed-training
- tag effects: https://pastebin.com/GurXf9a4
- stable diffusion resource goldmine: https://rentry.org/sdgoldmine
- some links https://rentry.org/AIDSimg
- vae comparison https://www.reddit.com/r/StableDiffusion/comments/ynn013/vae_comparison/
- prompt generator https://github.com/imrayya/stable-diffusion-webui-Prompt_Generator
- rozcestník https://rentry.org/RentrySD
- website full of tutorials https://stable-diffusion-art.com/
- https://rentry.org/UnofficialUnstableGuide
- hires návod https://www.youtube.com/watch?v=sre3bvNg2W0&ab_channel=SiliconThaumaturgy
- general tips and some nice models: https://www.youtube.com/watch?v=ezNDCWhv4pQ&ab_channel=OlivioSarikas
- notable embeddings https://huggingface.co/nolanaatama/embeddings/tree/main
- prompts from file https://www.youtube.com/watch?v=9PhZ2r1gnt8&t=98s&ab_channel=SiliconThaumaturgy
- prompt cheat sheet https://docs.google.com/spreadsheets/d/1YkX1pzJvYKrj_w6fhrpyaTyZvR687THp7QkxOVI4qEg/edit#gid=1511867707
- textual inversion https://textual-inversion.github.io/
- regional prompter https://stable-diffusion-art.com/regional-prompter/
- random nice prompts https://mpost.io/best-100-stable-diffusion-prompts-the-most-beautiful-ai-text-to-image-prompts/
- notable models
language models:
- pygmalion tips: https://rentry.org/pygtips
- virtual waifu, včetně jazykového modelu: https://rentry.org/diy-virtualwaifu
- https://rentry.org/pygmalion-local
- https://github.com/reworkd/AgentGPT
- https://github.com/oobabooga/text-generation-webui
- https://huggingface.co/databricks/dolly-v2-7b
- https://huggingface.co/PygmalionAI/pygmalion-7b
- gpt 4 alpaca uncensored: https://www.youtube.com/watch?v=nVC9D9fRyNU
- alpaca cpp fork https://github.com/antimatter15/alpaca.cpp
- freedomgpt
- jailbreak
- divné tokeny reddit usernames - protože tokenizer byl trénovaný na redditu bez čištění dat, a trénovaný model byl na čištěných - byte pair encoding trénink je nákladnější než trénink ML modelu