Skip to content

Instantly share code, notes, and snippets.

@mokemokechicken
Last active December 12, 2015 01:18
Show Gist options
  • Star 1 You must be signed in to star a gist
  • Fork 1 You must be signed in to fork a gist
  • Save mokemokechicken/4690081 to your computer and use it in GitHub Desktop.
Save mokemokechicken/4690081 to your computer and use it in GitHub Desktop.
Wavelet Convert Sample of Python.
# coding: utf8
# 2013/2/1 mokemokechicken@github.com
"""ウェーブレット変換のイメージを掴むためのサンプルスクリプト
Usage: python image_wavelet_transform.py <filename> (<level>:=3) (wavelet:=db1)
"""
import sys
from PIL import Image
import pywt, numpy
filename = sys.argv[1]
LEVEL = len(sys.argv) > 2 and int(sys.argv[2]) or 3
WAVLET = len(sys.argv) > 3 and sys.argv[3] or "db1"
def merge_images(cA, cH_V_D):
"""numpy.array を 4つ(左上、(右上、左下、右下))くっつける"""
cH, cV, cD = cH_V_D
print cA.shape, cH.shape, cV.shape, cD.shape
cA = cA[0:cH.shape[0], 0:cV.shape[1]] # 元画像が2の累乗でない場合、端数ができることがあるので、サイズを合わせる。小さい方に合わせます。
return numpy.vstack((numpy.hstack((cA,cH)), numpy.hstack((cV, cD)))) # 左上、右上、左下、右下、で画素をくっつける
def create_image(ary):
"""numpy.array を Grayscale画像に変換する"""
newim = Image.new("L", ary.shape)
newim.putdata(ary.flatten())
return newim
def wavlet_transform_to_image(gray_image, level, wavlet="db1", mode="sym"):
"""gray画像をlevel階層分Wavelet変換して、各段階を画像表現で返す
return [復元レベル0の画像, 復元レベル1の画像,... , 復元レベル<level-1>の画像, 各2D係数を1枚の画像にした画像]
"""
ret = []
data = numpy.array(list(gray_image.getdata()), dtype=numpy.float64).reshape(gray_image.size)
images = pywt.wavedec2(data, wavlet, level=level, mode=mode) # http://www.pybytes.com/pywavelets/ref/2d-dwt-and-idwt.html
for i in range(2, len(images)+1): # 部分的に復元して ret に詰める
ary = pywt.waverec2(images[0:i], WAVLET) * 2**(i-1) / 2**level # 部分的に復元すると加算されていた値が戻らない(白っぽくなってしまう)ので調整
ret.append(create_image(ary))
# 各2D係数を1枚の画像にする
merge = images[0] / (2**level) # cA の 部分は値が加算されていくので、画像表示のため平均をとる
for i in range(1, len(images)):
merge = merge_images(merge, images[i]) # 4つの画像を合わせていく
ret.append(create_image(merge))
return ret
if __name__ == "__main__":
im = Image.open(filename)
if im.size[0] != im.size[1]: # 縦横サイズが同じじゃないとなんか上手くいかないので、とりあえず合わせておく
max_size = max(im.size)
newim = Image.new(im.mode, (max_size, max_size))
newim.paste(im, (0,0))
im = newim
im.getdata() # これを呼んでおかないと何故か次の split() が失敗する・・・?なぜ?
bands = im.split() # RGBの各チャネル毎に処理をする
converted_bands_array = [wavlet_transform_to_image(gray, LEVEL, wavlet=WAVLET) for gray in bands] # 各RGBチャネル毎に変換
# zip(*hoge) がわかりにくいけど、 converted_bands には (R,G,B)の画像(PIL.Image)が入る. mergeでRGB画像に復元
converted_array = [Image.merge(im.mode, converted_bands) for converted_bands in zip(*converted_bands_array)]
# converted_array: [復元レベル0の画像, 復元レベル1の画像,... , 復元レベル<level-1>の画像, 各2D係数を1枚の画像にした画像]
for i, img in enumerate(converted_array):
img.save("%s_%d.png" % (filename, i)) # 適当に画像出力
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment