AkiYumo/gist:881cb96ccc2220cb26706fa0bb64024d

## gistfile1.txt
# Install Chainer and CuPy!

!apt -y install libcusparse8.0 libnvrtc8.0 libnvtoolsext1
!ln -snf /usr/lib/x86_64-linux-gnu/libnvrtc-builtins.so.8.0 /usr/lib/x86_64-linux-gnu/libnvrtc-builtins.so
!pip install https://github.com/kmaehashi/chainer-colab/releases/download/2018-02-06/cupy_cuda80-4.0.0b3-cp36-cp36m-linux_x86_64.whl
!pip install 'chainer==4.0.0b3'


#!/usr/bin/env python

import os

import numpy as np
from PIL import Image

import chainer
import chainer.backends.cuda
from chainer import Variable


def out_generated_image(gen, dis, rows, cols, seed, dst):
    @chainer.training.make_extension()
    def make_image(trainer):
        np.random.seed(seed)
        n_images = rows * cols
        xp = gen.xp
        z = Variable(xp.asarray(gen.make_hidden(n_images)))
        with chainer.using_config('train', False):
            x = gen(z)
        x = chainer.backends.cuda.to_cpu(x.data)
        np.random.seed()

        x = np.asarray(np.clip(x * 255, 0.0, 255.0), dtype=np.uint8)
        _, _, H, W = x.shape
        x = x.reshape((rows, cols, 3, H, W))
        x = x.transpose(0, 3, 1, 4, 2)
        x = x.reshape((rows * H, cols * W, 3))

        preview_dir = '{}/preview'.format(dst)
        preview_path = preview_dir +'/image{:0>8}.png'.format(trainer.updater.iteration)
        if not os.path.exists(preview_dir):
            os.makedirs(preview_dir)
        Image.fromarray(x).save(preview_path)
    return make_image


    #!/usr/bin/env python
import numpy

import chainer
from chainer.backends import cuda
import chainer.functions as F
import chainer.links as L


def add_noise(h, sigma=0.2):
    xp = cuda.get_array_module(h.data)
    if chainer.config.train:
        return h + sigma * xp.random.randn(*h.shape)
    else:
        return h


class Generator(chainer.Chain):

    def __init__(self, n_hidden, bottom_width=4, ch=512, wscale=0.02):
        super(Generator, self).__init__()
        self.n_hidden = n_hidden
        self.ch = ch
        self.bottom_width = bottom_width

        with self.init_scope():
            w = chainer.initializers.Normal(wscale)
            self.l0 = L.Linear(self.n_hidden, bottom_width * bottom_width * ch,
                               initialW=w)
            self.dc1 = L.Deconvolution2D(ch, ch // 2, 4, 2, 1, initialW=w)
            self.dc2 = L.Deconvolution2D(ch // 2, ch // 4, 4, 2, 1, initialW=w)
            self.dc3 = L.Deconvolution2D(ch // 4, ch // 8, 4, 2, 1, initialW=w)
            self.dc4 = L.Deconvolution2D(ch // 8, 3, 3, 1, 1, initialW=w)
            self.bn0 = L.BatchNormalization(bottom_width * bottom_width * ch)
            self.bn1 = L.BatchNormalization(ch // 2)
            self.bn2 = L.BatchNormalization(ch // 4)
            self.bn3 = L.BatchNormalization(ch // 8)

    def make_hidden(self, batchsize):
        return numpy.random.uniform(-1, 1, (batchsize, self.n_hidden, 1, 1)).astype(numpy.float32)

    def __call__(self, z):
        h = F.reshape(F.relu(self.bn0(self.l0(z))),
                      (len(z), self.ch, self.bottom_width, self.bottom_width))
        h = F.relu(self.bn1(self.dc1(h)))
        h = F.relu(self.bn2(self.dc2(h)))
        h = F.relu(self.bn3(self.dc3(h)))
        x = F.sigmoid(self.dc4(h))
        return x


class Discriminator(chainer.Chain):

    def __init__(self, bottom_width=4, ch=512, wscale=0.02):
        w = chainer.initializers.Normal(wscale)
        super(Discriminator, self).__init__()
        with self.init_scope():
            self.c0_0 = L.Convolution2D(3, ch // 8, 3, 1, 1, initialW=w)
            self.c0_1 = L.Convolution2D(ch // 8, ch // 4, 4, 2, 1, initialW=w)
            self.c1_0 = L.Convolution2D(ch // 4, ch // 4, 3, 1, 1, initialW=w)
            self.c1_1 = L.Convolution2D(ch // 4, ch // 2, 4, 2, 1, initialW=w)
            self.c2_0 = L.Convolution2D(ch // 2, ch // 2, 3, 1, 1, initialW=w)
            self.c2_1 = L.Convolution2D(ch // 2, ch // 1, 4, 2, 1, initialW=w)
            self.c3_0 = L.Convolution2D(ch // 1, ch // 1, 3, 1, 1, initialW=w)
            self.l4 = L.Linear(bottom_width * bottom_width * ch, 1, initialW=w)
            self.bn0_1 = L.BatchNormalization(ch // 4, use_gamma=False)
            self.bn1_0 = L.BatchNormalization(ch // 4, use_gamma=False)
            self.bn1_1 = L.BatchNormalization(ch // 2, use_gamma=False)
            self.bn2_0 = L.BatchNormalization(ch // 2, use_gamma=False)
            self.bn2_1 = L.BatchNormalization(ch // 1, use_gamma=False)
            self.bn3_0 = L.BatchNormalization(ch // 1, use_gamma=False)

    def __call__(self, x):
        h = add_noise(x)
        h = F.leaky_relu(add_noise(self.c0_0(h)))
        h = F.leaky_relu(add_noise(self.bn0_1(self.c0_1(h))))
        h = F.leaky_relu(add_noise(self.bn1_0(self.c1_0(h))))
        h = F.leaky_relu(add_noise(self.bn1_1(self.c1_1(h))))
        h = F.leaky_relu(add_noise(self.bn2_0(self.c2_0(h))))
        h = F.leaky_relu(add_noise(self.bn2_1(self.c2_1(h))))
        h = F.leaky_relu(add_noise(self.bn3_0(self.c3_0(h))))
        return self.l4(h)


#!/usr/bin/env python
import chainer
import chainer.functions as F
from chainer import Variable


class DCGANUpdater(chainer.training.updaters.StandardUpdater):

    def __init__(self, *args, **kwargs):
        self.gen, self.dis = kwargs.pop('models')
        super(DCGANUpdater, self).__init__(*args, **kwargs)

    def loss_dis(self, dis, y_fake, y_real):
        batchsize = len(y_fake)
        L1 = F.sum(F.softplus(-y_real)) / batchsize
        L2 = F.sum(F.softplus(y_fake)) / batchsize
        loss = L1 + L2
        chainer.report({'loss': loss}, dis)
        return loss

    def loss_gen(self, gen, y_fake):
        batchsize = len(y_fake)
        loss = F.sum(F.softplus(-y_fake)) / batchsize
        chainer.report({'loss': loss}, gen)
        return loss

    def update_core(self):
        gen_optimizer = self.get_optimizer('gen')
        dis_optimizer = self.get_optimizer('dis')

        batch = self.get_iterator('main').next()
        x_real = Variable(self.converter(batch, self.device)) / 255.
        xp = chainer.backends.cuda.get_array_module(x_real.data)

        gen, dis = self.gen, self.dis
        batchsize = len(batch)

        y_real = dis(x_real)

        z = Variable(xp.asarray(gen.make_hidden(batchsize)))
        x_fake = gen(z)
        y_fake = dis(x_fake)

        dis_optimizer.update(self.loss_dis, dis, y_fake, y_real)
        gen_optimizer.update(self.loss_gen, gen, y_fake)


#!/usr/bin/env python
import argparse
import os

import chainer
from chainer import training
from chainer.training import extensions

#from net import Discriminator
#from net import Generator
#from updater import DCGANUpdater
#from visualize import out_generated_image


#parser = argparse.ArgumentParser(description='Chainer example: DCGAN')

batchsize = 50
epoch=1000
gpu=0
dataset=''
out='result'
resume=''
n_hidden=100
seed=0
snapshot_interval=1000
display_interval=100
#args = parser.parse_args()


print('GPU: {}'.format(gpu))

print('# Minibatch-size: {}'.format(batchsize))

print('# n_hidden: {}'.format(n_hidden))

print('# epoch: {}'.format(epoch))

print('')


# Set up a neural network to train

gen = Generator(n_hidden=n_hidden)

dis = Discriminator()


if gpu >= 0:

    # Make a specified GPU current

    chainer.backends.cuda.get_device_from_id(gpu).use()

    gen.to_gpu()  # Copy the model to the GPU


dis.to_gpu()


# Setup an optimizer

def make_optimizer(model, alpha=0.0002, beta1=0.5):

    optimizer = chainer.optimizers.Adam(alpha=alpha, beta1=beta1)

    optimizer.setup(model)

    #optimizer.add_hook(chainer.optimizer_hooks.WeightDecay(0.0001), 'hook_dec')

    return optimizer

opt_gen = make_optimizer(gen)

opt_dis = make_optimizer(dis)


if dataset == '':

    # Load the CIFAR10 dataset if args.dataset is not specified

    train, _ = chainer.datasets.get_cifar10(withlabel=False, scale=255.)
else:

    all_files = os.listdir(dataset)

    image_files = [f for f in all_files if ('png' in f or 'jpg' in f)]

    print('{} contains {} image files'
              .format(dataset, len(image_files)))
    print(image_files)

    train = chainer.datasets.ImageDataset(image_files,root=dataset)


    print(train.__getitem__(1).shape)

train_iter = chainer.iterators.SerialIterator(train, batchsize)
print(train_iter)
# Set up a trainer

updater = DCGANUpdater(
        models=(gen, dis),
        iterator=train_iter,
        optimizer={
            'gen': opt_gen, 'dis': opt_dis},
        device=gpu)

trainer = training.Trainer(updater, (epoch, 'epoch'), out=out)

snapshot_interval = (snapshot_interval, 'iteration')

display_interval = (display_interval, 'iteration')

trainer.extend(

    extensions.snapshot(filename='snapshot_iter_{.updater.iteration}.npz'),

    trigger=snapshot_interval)

trainer.extend(extensions.snapshot_object(
    gen, 'gen_iter_{.updater.iteration}.npz'), trigger=snapshot_interval)
trainer.extend(extensions.snapshot_object(
    dis, 'dis_iter_{.updater.iteration}.npz'), trigger=snapshot_interval)
trainer.extend(extensions.LogReport(trigger=display_interval))
trainer.extend(extensions.PrintReport([
    'epoch', 'iteration', 'gen/loss', 'dis/loss',
    ]), trigger=display_interval)
trainer.extend(extensions.ProgressBar(update_interval=10))
trainer.extend(
    out_generated_image(
        gen, dis,
        10, 10, seed, out),
        trigger=snapshot_interval)

if resume:

    # Resume from a snapshot

    chainer.serializers.load_npz(resume, trainer)

# Run the training
trainer.run()
	# Install Chainer and CuPy!

	!apt -y install libcusparse8.0 libnvrtc8.0 libnvtoolsext1
	!ln -snf /usr/lib/x86_64-linux-gnu/libnvrtc-builtins.so.8.0 /usr/lib/x86_64-linux-gnu/libnvrtc-builtins.so
	!pip install https://github.com/kmaehashi/chainer-colab/releases/download/2018-02-06/cupy_cuda80-4.0.0b3-cp36-cp36m-linux_x86_64.whl
	!pip install 'chainer==4.0.0b3'


	#!/usr/bin/env python

	import os

	import numpy as np
	from PIL import Image

	import chainer
	import chainer.backends.cuda
	from chainer import Variable


	def out_generated_image(gen, dis, rows, cols, seed, dst):
	@chainer.training.make_extension()
	def make_image(trainer):
	np.random.seed(seed)
	n_images = rows * cols
	xp = gen.xp
	z = Variable(xp.asarray(gen.make_hidden(n_images)))
	with chainer.using_config('train', False):
	x = gen(z)
	x = chainer.backends.cuda.to_cpu(x.data)
	np.random.seed()

	x = np.asarray(np.clip(x * 255, 0.0, 255.0), dtype=np.uint8)
	_, _, H, W = x.shape
	x = x.reshape((rows, cols, 3, H, W))
	x = x.transpose(0, 3, 1, 4, 2)
	x = x.reshape((rows * H, cols * W, 3))

	preview_dir = '{}/preview'.format(dst)
	preview_path = preview_dir +'/image{:0>8}.png'.format(trainer.updater.iteration)
	if not os.path.exists(preview_dir):
	os.makedirs(preview_dir)
	Image.fromarray(x).save(preview_path)
	return make_image


	#!/usr/bin/env python
	import numpy

	import chainer
	from chainer.backends import cuda
	import chainer.functions as F
	import chainer.links as L


	def add_noise(h, sigma=0.2):
	xp = cuda.get_array_module(h.data)
	if chainer.config.train:
	return h + sigma * xp.random.randn(*h.shape)
	else:
	return h


	class Generator(chainer.Chain):

	def __init__(self, n_hidden, bottom_width=4, ch=512, wscale=0.02):
	super(Generator, self).__init__()
	self.n_hidden = n_hidden
	self.ch = ch
	self.bottom_width = bottom_width

	with self.init_scope():
	w = chainer.initializers.Normal(wscale)
	self.l0 = L.Linear(self.n_hidden, bottom_width * bottom_width * ch,
	initialW=w)
	self.dc1 = L.Deconvolution2D(ch, ch // 2, 4, 2, 1, initialW=w)
	self.dc2 = L.Deconvolution2D(ch // 2, ch // 4, 4, 2, 1, initialW=w)
	self.dc3 = L.Deconvolution2D(ch // 4, ch // 8, 4, 2, 1, initialW=w)
	self.dc4 = L.Deconvolution2D(ch // 8, 3, 3, 1, 1, initialW=w)
	self.bn0 = L.BatchNormalization(bottom_width * bottom_width * ch)
	self.bn1 = L.BatchNormalization(ch // 2)
	self.bn2 = L.BatchNormalization(ch // 4)
	self.bn3 = L.BatchNormalization(ch // 8)

	def make_hidden(self, batchsize):
	return numpy.random.uniform(-1, 1, (batchsize, self.n_hidden, 1, 1)).astype(numpy.float32)

	def __call__(self, z):
	h = F.reshape(F.relu(self.bn0(self.l0(z))),
	(len(z), self.ch, self.bottom_width, self.bottom_width))
	h = F.relu(self.bn1(self.dc1(h)))
	h = F.relu(self.bn2(self.dc2(h)))
	h = F.relu(self.bn3(self.dc3(h)))
	x = F.sigmoid(self.dc4(h))
	return x


	class Discriminator(chainer.Chain):

	def __init__(self, bottom_width=4, ch=512, wscale=0.02):
	w = chainer.initializers.Normal(wscale)
	super(Discriminator, self).__init__()
	with self.init_scope():
	self.c0_0 = L.Convolution2D(3, ch // 8, 3, 1, 1, initialW=w)
	self.c0_1 = L.Convolution2D(ch // 8, ch // 4, 4, 2, 1, initialW=w)
	self.c1_0 = L.Convolution2D(ch // 4, ch // 4, 3, 1, 1, initialW=w)
	self.c1_1 = L.Convolution2D(ch // 4, ch // 2, 4, 2, 1, initialW=w)
	self.c2_0 = L.Convolution2D(ch // 2, ch // 2, 3, 1, 1, initialW=w)
	self.c2_1 = L.Convolution2D(ch // 2, ch // 1, 4, 2, 1, initialW=w)
	self.c3_0 = L.Convolution2D(ch // 1, ch // 1, 3, 1, 1, initialW=w)
	self.l4 = L.Linear(bottom_width * bottom_width * ch, 1, initialW=w)
	self.bn0_1 = L.BatchNormalization(ch // 4, use_gamma=False)
	self.bn1_0 = L.BatchNormalization(ch // 4, use_gamma=False)
	self.bn1_1 = L.BatchNormalization(ch // 2, use_gamma=False)
	self.bn2_0 = L.BatchNormalization(ch // 2, use_gamma=False)
	self.bn2_1 = L.BatchNormalization(ch // 1, use_gamma=False)
	self.bn3_0 = L.BatchNormalization(ch // 1, use_gamma=False)

	def __call__(self, x):
	h = add_noise(x)
	h = F.leaky_relu(add_noise(self.c0_0(h)))
	h = F.leaky_relu(add_noise(self.bn0_1(self.c0_1(h))))
	h = F.leaky_relu(add_noise(self.bn1_0(self.c1_0(h))))
	h = F.leaky_relu(add_noise(self.bn1_1(self.c1_1(h))))
	h = F.leaky_relu(add_noise(self.bn2_0(self.c2_0(h))))
	h = F.leaky_relu(add_noise(self.bn2_1(self.c2_1(h))))
	h = F.leaky_relu(add_noise(self.bn3_0(self.c3_0(h))))
	return self.l4(h)


	#!/usr/bin/env python
	import chainer
	import chainer.functions as F
	from chainer import Variable


	class DCGANUpdater(chainer.training.updaters.StandardUpdater):

	def __init__(self, args, *kwargs):
	self.gen, self.dis = kwargs.pop('models')
	super(DCGANUpdater, self).__init__(args, *kwargs)

	def loss_dis(self, dis, y_fake, y_real):
	batchsize = len(y_fake)
	L1 = F.sum(F.softplus(-y_real)) / batchsize
	L2 = F.sum(F.softplus(y_fake)) / batchsize
	loss = L1 + L2
	chainer.report({'loss': loss}, dis)
	return loss

	def loss_gen(self, gen, y_fake):
	batchsize = len(y_fake)
	loss = F.sum(F.softplus(-y_fake)) / batchsize
	chainer.report({'loss': loss}, gen)
	return loss

	def update_core(self):
	gen_optimizer = self.get_optimizer('gen')
	dis_optimizer = self.get_optimizer('dis')

	batch = self.get_iterator('main').next()
	x_real = Variable(self.converter(batch, self.device)) / 255.
	xp = chainer.backends.cuda.get_array_module(x_real.data)

	gen, dis = self.gen, self.dis
	batchsize = len(batch)

	y_real = dis(x_real)

	z = Variable(xp.asarray(gen.make_hidden(batchsize)))
	x_fake = gen(z)
	y_fake = dis(x_fake)

	dis_optimizer.update(self.loss_dis, dis, y_fake, y_real)
	gen_optimizer.update(self.loss_gen, gen, y_fake)


	#!/usr/bin/env python
	import argparse
	import os

	import chainer
	from chainer import training
	from chainer.training import extensions

	#from net import Discriminator
	#from net import Generator
	#from updater import DCGANUpdater
	#from visualize import out_generated_image



	#parser = argparse.ArgumentParser(description='Chainer example: DCGAN')

	batchsize = 50
	epoch=1000
	gpu=0
	dataset=''
	out='result'
	resume=''
	n_hidden=100
	seed=0
	snapshot_interval=1000
	display_interval=100
	#args = parser.parse_args()


	print('GPU: {}'.format(gpu))

	print('# Minibatch-size: {}'.format(batchsize))

	print('# n_hidden: {}'.format(n_hidden))

	print('# epoch: {}'.format(epoch))

	print('')


	# Set up a neural network to train

	gen = Generator(n_hidden=n_hidden)

	dis = Discriminator()


	if gpu >= 0:

	# Make a specified GPU current

	chainer.backends.cuda.get_device_from_id(gpu).use()

	gen.to_gpu() # Copy the model to the GPU


	dis.to_gpu()


	# Setup an optimizer

	def make_optimizer(model, alpha=0.0002, beta1=0.5):

	optimizer = chainer.optimizers.Adam(alpha=alpha, beta1=beta1)

	optimizer.setup(model)

	#optimizer.add_hook(chainer.optimizer_hooks.WeightDecay(0.0001), 'hook_dec')

	return optimizer

	opt_gen = make_optimizer(gen)

	opt_dis = make_optimizer(dis)


	if dataset == '':

	# Load the CIFAR10 dataset if args.dataset is not specified

	train, _ = chainer.datasets.get_cifar10(withlabel=False, scale=255.)
	else:

	all_files = os.listdir(dataset)

	image_files = [f for f in all_files if ('png' in f or 'jpg' in f)]

	print('{} contains {} image files'
	.format(dataset, len(image_files)))
	print(image_files)

	train = chainer.datasets.ImageDataset(image_files,root=dataset)


	print(train.__getitem__(1).shape)

	train_iter = chainer.iterators.SerialIterator(train, batchsize)
	print(train_iter)
	# Set up a trainer

	updater = DCGANUpdater(
	models=(gen, dis),
	iterator=train_iter,
	optimizer={
	'gen': opt_gen, 'dis': opt_dis},
	device=gpu)

	trainer = training.Trainer(updater, (epoch, 'epoch'), out=out)

	snapshot_interval = (snapshot_interval, 'iteration')

	display_interval = (display_interval, 'iteration')

	trainer.extend(

	extensions.snapshot(filename='snapshot_iter_{.updater.iteration}.npz'),

	trigger=snapshot_interval)

	trainer.extend(extensions.snapshot_object(
	gen, 'gen_iter_{.updater.iteration}.npz'), trigger=snapshot_interval)
	trainer.extend(extensions.snapshot_object(
	dis, 'dis_iter_{.updater.iteration}.npz'), trigger=snapshot_interval)
	trainer.extend(extensions.LogReport(trigger=display_interval))
	trainer.extend(extensions.PrintReport([
	'epoch', 'iteration', 'gen/loss', 'dis/loss',
	]), trigger=display_interval)
	trainer.extend(extensions.ProgressBar(update_interval=10))
	trainer.extend(
	out_generated_image(
	gen, dis,
	10, 10, seed, out),
	trigger=snapshot_interval)

	if resume:

	# Resume from a snapshot

	chainer.serializers.load_npz(resume, trainer)

	# Run the training
	trainer.run()