racinmat/animefest-2023-stable-diffusion.md

## animefest-2023-stable-diffusion.md

      
    Raw
  

              animefest-2023-stable-diffusion.md
            
          
    Návod na zprovoznění AI generátoru obrázků doma a technické informace

Demo běželo na běžné herní GPU, konkrétně GTX 1080.
Software by měl jít bez problémů nainstalovat na jakoukoli Nvidia GPU s dostatečnou pamětí (aspoň 4GB, spíš 6GB, u 4GB povypínejte ostatní věci). Lze to zprovoznit i na AMD GPU, ale je to komplikovanější.
Generátor obrázků je neuronová síť založená na Stable Diffusion v1.5. Grafické rozhranní (klikátko je web UI od Automatic1111.
Pro účely AnimeFestu jsem rozhraní upravil, a všechny úpravy jsou v mém forku: https://github.com/racinmat/stable-diffusion-webui
Tento fork primárně umožňuje schovat většinu UI, aby to bylo jednodušší pro návštěvníky.
Pokud si chcete generovat doma a hrát si s nastavením, doporučuji původní repo: https://github.com/AUTOMATIC1111/stable-diffusion-webui.
Pokud chcete použít můj fork, postupujte podle návodu na instalaci z https://github.com/AUTOMATIC1111/stable-diffusion-webui#installation-and-running, ale místo git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git použijte git clone https://github.com/racinmat/stable-diffusion-webui.git
Pokud chcete použít můj fork, ale mít přístupné i jiné taby (např. Settings apod.), upravte řádek https://github.com/racinmat/stable-diffusion-webui/blob/master/config-af.json#L115 a odeberte všechny taby, které chcete vidět.
Použitý model: Kenshi 01, pruned, f16

https://huggingface.co/SweetLuna/Kenshi/blob/main/KENSHI%2001/KENSHI01_Pruned_f16.safetensors
https://civitai.com/models/3850

Použitý variační autoencoder (VAE): kl-f8-anime2

https://huggingface.co/hakurei/waifu-diffusion-v1-4/blob/main/vae/kl-f8-anime2.ckpt
https://civitai.com/models/23906/kl-f8-anime2-vae

Návod na spuštění a technické požadavky: viz readme v repu https://github.com/AUTOMATIC1111/stable-diffusion-webui
Jeden z mnoha návodů na zprovoznění: https://stable-diffusion-art.com/install-windows/
AUTOMATIC1111/stable-diffusion-webui má poměrně rozsáhlou wiki se spoustou návodů: https://github.com/AUTOMATIC1111/stable-diffusion-webui/wiki
Do stable diffusion web ui existuje mnoho extensions, za zmínku stojí např. kontrola pózy na obrázku https://github.com/AUTOMATIC1111/stable-diffusion-webui/wiki/Extensions#openpose-editor nebo např. výše zmíněný diffusion defender https://github.com/AUTOMATIC1111/stable-diffusion-webui/wiki/Extensions#diffusion-defender
Přednáška o AI a zdroje na letošním AF:

přednáška http://bit.ly/animefest-skynet-slides
zdroje http://bit.ly/animefest-skynet-sources

Modifikace mého forku

Oproti původnímu repu je u mnoha tlačítek přidán label, aby byly v konfiguráku. U většiny UI prvků je nastaveno, aby byly skryté, abychom měli jednodušší UI pro běžné uživatele. Původní repo má plné UI. Puštění mého forku s původními konfiguráky je možné po nastavení:
set COMMANDLINE_ARGS=--theme dark --ui-settings-file=config.json --ui-config-file=ui-config-default.json
v webui-user.bat.
Většina skrytých parametrů je nastavená na rozumné defaultní hodnoty.
Je tam doinstalována extensiona https://github.com/WildBanjos/DiffusionDefender, konkrétně můj fork https://github.com/racinmat/DiffusionDefender, s vlastním blacklistem, aby během festivalo nebylo snadné generovat porno.
Je tam také schován a zahardcoděn negative prompt komplikující generování porna. Není problém doma pustit stable diffusion s jiným negative promptem a nebo extension/s prázdným blacklistem v extension, a generovat si doma porno.
modely

Web UI umožňuje používat mnoho modelů a přepínat mezi nimi, modely můžete najít na těchto webech, kde jsou zdarma volně dostupné:

https://huggingface.co/models?pipeline_tag=text-to-image
https://civitai.com/

odkud stahnete model, dáte do příslušné složky, a ve Web UI půjde načíst.
poznámky

Při spuštění se stahuje pytorch_model.bin, co má cca 1.7GB, viz AUTOMATIC1111/stable-diffusion-webui#9182, dá se stahnout předem z https://huggingface.co/openai/clip-vit-large-patch14/tree/main
odkazy a materiály


Základní guide: https://rentry.org/voldy
Schizo negative: https://rentry.org/SchizoNegative
Supreme schizo negative (není tak schizo, ale název se ujal): https://rentry.org/schizoneg
Reozcestník na články z 4chan /hdg/: https://rentry.org/hdg-collab-master
/hdg/ Prompt assist: https://rentry.org/hdgpromptassist
lora training: https://rentry.org/lora_train
lora repo: https://rentry.org/hdglorarepo
nai prior v2: https://rentry.org/nai-prior-v2
stable diffusion vs automatic1111: https://rentry.org/sd-issues
berry mix guide: https://rentry.org/berrymix
stable diffusion models: https://rentry.org/sdmodels
velký článek o generování obrázků: https://rentry.org/animusmixed
embedded training pro postavy: https://rentry.org/simplified-embed-training
tag effects: https://pastebin.com/GurXf9a4
stable diffusion resource goldmine: https://rentry.org/sdgoldmine
some links https://rentry.org/AIDSimg
vae comparison https://www.reddit.com/r/StableDiffusion/comments/ynn013/vae_comparison/
prompt generator https://github.com/imrayya/stable-diffusion-webui-Prompt_Generator
rozcestník https://rentry.org/RentrySD
website full of tutorials https://stable-diffusion-art.com/

https://stable-diffusion-art.com/automatic1111/


https://rentry.org/UnofficialUnstableGuide
hires návod https://www.youtube.com/watch?v=sre3bvNg2W0&ab_channel=SiliconThaumaturgy
general tips and some nice models: https://www.youtube.com/watch?v=ezNDCWhv4pQ&ab_channel=OlivioSarikas
notable embeddings https://huggingface.co/nolanaatama/embeddings/tree/main
prompts from file https://www.youtube.com/watch?v=9PhZ2r1gnt8&t=98s&ab_channel=SiliconThaumaturgy
prompt cheat sheet https://docs.google.com/spreadsheets/d/1YkX1pzJvYKrj_w6fhrpyaTyZvR687THp7QkxOVI4qEg/edit#gid=1511867707
textual inversion https://textual-inversion.github.io/
regional prompter https://stable-diffusion-art.com/regional-prompter/
random nice prompts https://mpost.io/best-100-stable-diffusion-prompts-the-most-beautiful-ai-text-to-image-prompts/
notable models

https://huggingface.co/Envvi/Inkpunk-Diffusion/tree/main


language models:

pygmalion tips: https://rentry.org/pygtips
virtual waifu, včetně jazykového modelu: https://rentry.org/diy-virtualwaifu
https://rentry.org/pygmalion-local
https://github.com/reworkd/AgentGPT
https://github.com/oobabooga/text-generation-webui
https://huggingface.co/databricks/dolly-v2-7b
https://huggingface.co/PygmalionAI/pygmalion-7b
gpt 4 alpaca uncensored: https://www.youtube.com/watch?v=nVC9D9fRyNU
alpaca cpp fork https://github.com/antimatter15/alpaca.cpp
freedomgpt

https://github.com/ohmplatform/FreedomGPT
https://freedomgpt.com/


jailbreak

https://knowyourmeme.com/memes/events/chatgpt-dan-50-jailbreak
https://www.reddit.com/r/copypasta/comments/110suqj/chatgpt_dan_hack/
https://gist.github.com/coolaj86/6f4f7b30129b0251f61fa7baaa881516
poisoning microsoft chat to pirate data https://greshake.github.io/


divné tokeny reddit usernames - protože tokenizer byl trénovaný na redditu bez čištění dat, a trénovaný model byl na čištěných - byte pair encoding trénink je nákladnější než trénink ML modelu

https://www.lesswrong.com/posts/aPeJE8bSo6rAFoLqg/solidgoldmagikarp-plus-prompt-generation
https://www.vice.com/en/article/epzyva/ai-chatgpt-tokens-words-break-reddit