pablomm/img2img_ovam_example.py

## img2img_ovam_example.py
import torch
from diffusers import StableDiffusionImg2ImgPipeline
from ovam import StableDiffusionHooker
from ovam.utils import set_seed
import requests
from io import BytesIO
import matplotlib.pyplot as plt
from PIL import Image

device = "cuda"
model_id_or_path = "runwayml/stable-diffusion-v1-5"
pipe = StableDiffusionImg2ImgPipeline.from_pretrained(model_id_or_path, torch_dtype=torch.float16)
pipe = pipe.to(device)

url = "https://raw.githubusercontent.com/CompVis/stable-diffusion/main/assets/stable-samples/img2img/sketch-mountains-input.jpg"

response = requests.get(url)
init_image = Image.open(BytesIO(response.content)).convert("RGB")
init_image = init_image.resize((512, 512))

prompt = "A fantasy landscape, trending on artstation"

# Generate image storing the internal attentions
set_seed(1)
with StableDiffusionHooker(pipe) as hooker:
  image = pipe(prompt=prompt, image=init_image, strength=0.75, guidance_scale=7.5).images[0]

# Evaluator of attention
ovam_evaluator = hooker.get_ovam_callable(expand_size=(512, 512))


with torch.no_grad():
    attention_maps = ovam_evaluator("castle")
    attention_maps = attention_maps[0].cpu().numpy() # (3, 512, 512)


attribution_prompt = "A castle"

with torch.no_grad():
    attention_maps = ovam_evaluator(attribution_prompt)
    attention_maps = attention_maps[0].cpu().numpy() # (3, 512, 512)


fig, (ax0, ax1, ax2) = plt.subplots(1, 3, figsize=(10, 4))

ax0.imshow(init_image)
ax1.imshow(image)
ax2.imshow(image)

# Normalize attentions [0, 1] to use as alpha in plot
castle_attention = attention_maps[2] # Castle is the third word <SoT> a castle<EoT>
castle_attention = (castle_attention - castle_attention.min())
castle_attention = castle_attention / castle_attention.max()

ax2.imshow(castle_attention, alpha=castle_attention.astype(float), cmap='jet')

ax0.set_title("Init image")
ax0.axis('off')

ax1.set_title("Generated image")
ax1.axis('off')

ax2.set_title("+ Castle attentions")
ax2.axis('off')

fig.savefig("example_img2img.jpg")
	import torch
	from diffusers import StableDiffusionImg2ImgPipeline
	from ovam import StableDiffusionHooker
	from ovam.utils import set_seed
	import requests
	from io import BytesIO
	import matplotlib.pyplot as plt
	from PIL import Image

	device = "cuda"
	model_id_or_path = "runwayml/stable-diffusion-v1-5"
	pipe = StableDiffusionImg2ImgPipeline.from_pretrained(model_id_or_path, torch_dtype=torch.float16)
	pipe = pipe.to(device)

	url = "https://raw.githubusercontent.com/CompVis/stable-diffusion/main/assets/stable-samples/img2img/sketch-mountains-input.jpg"

	response = requests.get(url)
	init_image = Image.open(BytesIO(response.content)).convert("RGB")
	init_image = init_image.resize((512, 512))

	prompt = "A fantasy landscape, trending on artstation"

	# Generate image storing the internal attentions
	set_seed(1)
	with StableDiffusionHooker(pipe) as hooker:
	image = pipe(prompt=prompt, image=init_image, strength=0.75, guidance_scale=7.5).images[0]

	# Evaluator of attention
	ovam_evaluator = hooker.get_ovam_callable(expand_size=(512, 512))


	with torch.no_grad():
	attention_maps = ovam_evaluator("castle")
	attention_maps = attention_maps[0].cpu().numpy() # (3, 512, 512)



	attribution_prompt = "A castle"

	with torch.no_grad():
	attention_maps = ovam_evaluator(attribution_prompt)
	attention_maps = attention_maps[0].cpu().numpy() # (3, 512, 512)



	fig, (ax0, ax1, ax2) = plt.subplots(1, 3, figsize=(10, 4))

	ax0.imshow(init_image)
	ax1.imshow(image)
	ax2.imshow(image)

	# Normalize attentions [0, 1] to use as alpha in plot
	castle_attention = attention_maps[2] # Castle is the third word <SoT> a castle<EoT>
	castle_attention = (castle_attention - castle_attention.min())
	castle_attention = castle_attention / castle_attention.max()

	ax2.imshow(castle_attention, alpha=castle_attention.astype(float), cmap='jet')

	ax0.set_title("Init image")
	ax0.axis('off')

	ax1.set_title("Generated image")
	ax1.axis('off')

	ax2.set_title("+ Castle attentions")
	ax2.axis('off')

	fig.savefig("example_img2img.jpg")