kris-singh/gan_conv.cpp

## gan_conv.cpp
#include <mlpack/core.hpp>
#include <mlpack/core/util/cli.hpp>

#include <mlpack/methods/ann/init_rules/gaussian_init.hpp>
#include <mlpack/methods/ann/layer/layer_types.hpp>
#include <mlpack/methods/ann/layer/layer.hpp>
#include <mlpack/methods/ann/gan.hpp>
#include <mlpack/methods/softmax_regression/softmax_regression.hpp>
#include <mlpack/core/optimizers/minibatch_sgd/minibatch_sgd.hpp>

using namespace mlpack;
using namespace mlpack::ann;
using namespace mlpack::math;
using namespace mlpack::optimization;
using namespace mlpack::regression;

PROGRAM_INFO("GAN", "Convolution");
PARAM_STRING_IN("dataset", "path/to/dataset.", "i", "mnist.arm");
PARAM_STRING_IN("output-dataset", "path/to/output.", "o", "output.txt");

PARAM_INT_IN("dataset-max-cols", "dataset max cols.", "m",  -1);
PARAM_INT_IN("batch-size", "batch-size.", "b", 100);
PARAM_INT_IN("generator-update-step", "generator-update-step.", "g", 100);
PARAM_INT_IN("discriminatorPreTrain", "discriminatorPreTrain", "x", 0);
PARAM_INT_IN("dNumKernels", "dNumKernels", "k", 32);
PARAM_INT_IN("noise-dim", "noise dim.", "N", 25);
PARAM_INT_IN("num-samples", "num samples.", "n", 1000);
PARAM_DOUBLE_IN("step-size", "learning rate.", "r", 0.01);
PARAM_INT_IN("num-epoches", "num-epoches.", "e", 20);
PARAM_DOUBLE_IN("tolerance", "tolerance.", "t", 1e-5);
PARAM_FLAG("shuffle", "shuffle or not", "s");


int main(int argc, char* argv[])
{
  /*
    #ifdef LOCAL
      freopen("output.txt", "w", stdout);
    #endif
  */
  // We treat the archtitechture as constant.
  CLI::ParseCommandLine(argc, argv);

  size_t dNumKernels = 32;
  size_t discriminatorPreTrain = 300;
  size_t batchSize = 50;
  size_t noiseDim = 10;
  size_t generatorUpdateStep = 1;
  size_t numSamples = 10;
  double stepSize = 0.0003;
  double eps = 1e-8;
  size_t numEpoches = 2000;
  double tolerance = 1e-5;
  int datasetMaxCols = -1;
  bool shuffle = true;
  double multiplier = 10;

  std::string dataset = CLI::GetParam<std::string>("dataset");
  std::string output_dataset = CLI::GetParam<std::string>("output-dataset");

  if (CLI::HasParam("dataset-max-cols"))
    datasetMaxCols = CLI::GetParam<int>("dataset-max-cols");

  if (CLI::HasParam("batch-size"))
    batchSize = CLI::GetParam<int>("batch-size");

  if (CLI::HasParam("generator-update-step"))
    generatorUpdateStep = CLI::GetParam<int>("generator-update-step");

  if (CLI::HasParam("noise-dim"))
    noiseDim = CLI::GetParam<int>("noise-dim");

  if (CLI::HasParam("num-samples"))
    numSamples = CLI::GetParam<int>("num-samples");

  if (CLI::HasParam("step-size"))
    stepSize = CLI::GetParam<double>("step-size");

  if (CLI::HasParam("num-epoches"))
    numEpoches = CLI::GetParam<int>("num-epoches");

  if (CLI::HasParam("tolerance"))
    tolerance = CLI::GetParam<double>("tolerance");

  if (CLI::HasParam("discriminatorPreTrain"))
    discriminatorPreTrain = CLI::GetParam<int>("discriminatorPreTrain");

  shuffle = CLI::HasParam("shuffle");

  Log::Info << "dataset = '" << dataset << "'" << std::endl;
  Log::Info << "output_dataset = '" << output_dataset << "'" << std::endl;
  Log::Info << std::boolalpha
      << " batchSize = " << batchSize
      << " generatorUpdateStep = " << generatorUpdateStep
      << " noiseDim = " << noiseDim
      << " numSamples = " << numSamples
      << " stepSize = " << stepSize
      << " numEpoches = " << numEpoches
      << " tolerance = " << tolerance
      << " shuffle = " << shuffle << std::endl;

  arma::mat trainData;
  trainData.load(dataset);

  if (datasetMaxCols > 0)
    trainData = trainData.cols(0, datasetMaxCols - 1);

  Log::Info << "Dataset loaded (" << trainData.n_rows << ", " << trainData.n_cols << ")" << std::endl;

  size_t numIterations = trainData.n_cols * numEpoches;
  numIterations /= batchSize;

  Log::Info << trainData.n_rows << "--------" << trainData.n_cols << std::endl;

  // Discriminator Network
  FFN<CrossEntropyErrorLogits<>> discriminator;
  discriminator.Add<Convolution<>>(1, dNumKernels, 5, 5, 1, 1, 2, 2, 28, 28);
  discriminator.Add<ReLULayer<>>();
  discriminator.Add<MeanPooling<>>(2, 2, 2, 2);
  discriminator.Add<Convolution<>>(dNumKernels, 2 * dNumKernels, 5, 5, 1, 1, 2, 2, 14, 14);
  discriminator.Add<ReLULayer<>>();
  discriminator.Add<MeanPooling<>>(2, 2, 2, 2);
  discriminator.Add<Linear<>>(7 * 7 * 2 * dNumKernels, 1024);
  discriminator.Add<ReLULayer<>>();
  discriminator.Add<Linear<>>(1024, 1);


  BiLinearFunction interpolation1(28, 28, 56, 56 , noiseDim / 2);
  BiLinearFunction interpolation2(28, 28, 56, 56 , noiseDim / 4);

  // Generator Network
  FFN<CrossEntropyErrorLogits<>> generator;
  generator.Add<Linear<>>(noiseDim, 3136);
  generator.Add<ReLULayer<>>();
  generator.Add<Convolution<>>(1, noiseDim / 2, 3, 3, 2, 2, 1, 1, 56, 56);
  generator.Add<ReLULayer<>>();
  generator.Add<Resize<> >(interpolation1);
  generator.Add<Convolution<>>(noiseDim / 2, noiseDim / 4, 3, 3, 2, 2, 1, 1, 56, 56);
  generator.Add<ReLULayer<>>();
  generator.Add<Resize<> >(interpolation2);
  generator.Add<Convolution<>>(noiseDim / 4, 1, 3, 3, 2, 2, 1, 1, 56, 56);
  generator.Add<ReLULayer<>>();
  generator.Add<SigmoidLayer<>>();

  // Intialisation function
  GaussianInitialization gaussian(0, 1);
  // Optimizer
  AdamBatchSGD optimizer(batchSize, stepSize, numIterations, tolerance, shuffle);

  std::function<double ()> noiseFunction = [] () { return math::RandNormal(0, 1);};

  // Train Gan with preTrain step size 300

  GAN<FFN<CrossEntropyErrorLogits<>>, GaussianInitialization, std::function<double ()>>
  gan(trainData, generator, discriminator, gaussian, noiseFunction,
      noiseDim, batchSize, generatorUpdateStep, discriminatorPreTrain,
      multiplier);

  Log::Info << "Training..." << std::endl;
  // std::cout << "Train" << std::endl;
  gan.Train(optimizer);

  // Generate samples
  Log::Info << "Sampling..." << std::endl;
  arma::mat noise(noiseDim, 1);
  size_t dim = std::sqrt(trainData.n_rows);
  arma::mat generatedData(2 * dim, dim * numSamples);
  for (size_t i = 0; i < numSamples; i++)
  {
    arma::mat samples;
    noise.imbue( [&]() { return noiseFunction(); } );
    generator.Forward(noise, samples);

    samples.reshape(dim, dim);
    samples = samples.t();

    generatedData.submat(0, i * dim, dim - 1, i * dim + dim - 1) = samples;


    samples = trainData.col(math::RandInt(0, trainData.n_cols));
    samples.reshape(dim, dim);
    samples = samples.t();

    generatedData.submat(dim, i * dim, 2 * dim - 1, i * dim + dim - 1) = samples;
  }

  Log::Info << "Saving output to " << output_dataset << "..." << std::endl;
  generatedData.save(output_dataset, arma::raw_ascii);
  Log::Info << "Output saved!" << std::endl;
}

## gan_gaussian.cpp
#include <mlpack/core.hpp>
#include <mlpack/core/util/cli.hpp>
#include <mlpack/methods/ann/init_rules/gaussian_init.hpp>
#include <mlpack/methods/ann/gan.hpp>
#include <mlpack/methods/softmax_regression/softmax_regression.hpp>
#include <mlpack/core/optimizers/minibatch_sgd/minibatch_sgd.hpp>

PROGRAM_INFO("GAN", "ERICJANG");
PARAM_STRING_IN("dataset", "path/to/dataset.", "i", "mnist.arm");
PARAM_STRING_IN("output-dataset", "path/to/output.", "o", "output.txt");

PARAM_INT_IN("dataset-max-cols", "dataset max cols.", "m",  -1);

PARAM_INT_IN("generator-hidden-layer-size", "hidden layer size.", "G",  128);
PARAM_INT_IN("discriminator-hidden-layer-size", "hidden layer size.", "D",  128);

PARAM_INT_IN("batch-size", "batch-size.", "b", 100);

PARAM_INT_IN("generator-update-step", "generator-update-step.", "g", 100);
PARAM_INT_IN("discriminator-pre-train", "discriminator-pre-train", "x", 0);
PARAM_INT_IN("noise-dim", "noise dim.", "N", 25);
PARAM_INT_IN("num-samples", "num samples.", "n", 1000);
PARAM_DOUBLE_IN("step-size", "learning rate.", "r", 0.01);
PARAM_INT_IN("num-epoches", "num-epoches.", "e", 20);
PARAM_DOUBLE_IN("tolerance", "tolerance.", "t", 1e-5);
PARAM_FLAG("shuffle", "shuffle or not", "s");

int main(int argc, char* argv[])
{
  #ifdef LOCAL
    freopen("output.txt", "w", stdout);
  #endif
  // Create 1000 samples of N(-1, 1)
  CLI::ParseCommandLine(argc, argv);
  size_t generatorHiddenLayerSize = 8;
  size_t discriminatorHiddenLayerSize = 8;
  size_t generatorOutputSize;
  size_t discriminatorOutputSize = 1;
  size_t discriminatorPreTrain = 0;
  size_t batchSize = 10;
  size_t noiseDim = 1;
  size_t generatorUpdateStep = 1;
  size_t numSamples = 10000;
  double stepSize = 0.001;
  double eps = 1e-8;
  size_t numEpoches = 20;
  double tolerance = 1e-5;
  int datasetMaxCols = -1;
  bool shuffle = true;


  double mean = 4;
  double variance = 0.5;

  std::string dataset = CLI::GetParam<std::string>("dataset");
  std::string output_dataset = CLI::GetParam<std::string>("output-dataset");

  if (CLI::HasParam("dataset-max-cols"))
    datasetMaxCols = CLI::GetParam<int>("dataset-max-cols");

  if (CLI::HasParam("generator-hidden-layer-size"))
    generatorHiddenLayerSize = CLI::GetParam<int>("generator-hidden-layer-size");

  if (CLI::HasParam("discriminator-hidden-layer-size"))
    discriminatorHiddenLayerSize = CLI::GetParam<int>("discriminator-hidden-layer-size");

  if (CLI::HasParam("batch-size"))
    batchSize = CLI::GetParam<int>("batch-size");

  if (CLI::HasParam("generator-update-step"))
    generatorUpdateStep = CLI::GetParam<int>("generator-update-step");

  if (CLI::HasParam("noise-dim"))
    noiseDim = CLI::GetParam<int>("noise-dim");

  if (CLI::HasParam("num-samples"))
    numSamples = CLI::GetParam<int>("num-samples");

  if (CLI::HasParam("step-size"))
    stepSize = CLI::GetParam<double>("step-size");

  if (CLI::HasParam("num-epoches"))
    numEpoches = CLI::GetParam<int>("num-epoches");

  if (CLI::HasParam("tolerance"))
    tolerance = CLI::GetParam<double>("tolerance");

  if (CLI::HasParam("discriminator-pre-train"))
    discriminatorPreTrain = CLI::GetParam<size_t>("discriminator-pre-train");

  shuffle = CLI::HasParam("shuffle");

  Log::Info << "dataset = '" << dataset << "'" << std::endl;
  Log::Info << "output_dataset = '" << output_dataset << "'" << std::endl;
  Log::Info << std::boolalpha
      << "generatorHiddenLayerSize = " << generatorHiddenLayerSize
      << " discriminatorHiddenLayerSize = " << discriminatorHiddenLayerSize
      << " batchSize = " << batchSize
      << " generatorUpdateStep = " << generatorUpdateStep
      << " noiseDim = " << noiseDim
      << " numSamples = " << numSamples
      << " stepSize = " << stepSize
      << " numEpoches = " << numEpoches
      << " tolerance = " << tolerance
      << " shuffle = " << shuffle << std::endl;

  arma::mat trainData(1, 10000);
  trainData.imbue( [&]() { return arma::as_scalar(RandNormal(mean, variance));});
  trainData = arma::sort(trainData);

  if (datasetMaxCols > 0)
    trainData = trainData.cols(0, datasetMaxCols - 1);

  Log::Info << "Dataset loaded (" << trainData.n_rows << ", " << trainData.n_cols << ")" << std::endl;
  generatorOutputSize = trainData.n_rows;

  size_t numIterations = trainData.n_cols * numEpoches;
  numIterations /= batchSize;

  // Create the Discrminator network
  FFN<CrossEntropyError<>> discriminator;
  discriminator.Add<Linear<>> (generatorOutputSize, discriminatorHiddenLayerSize * 2);
  discriminator.Add<ReLULayer<>>();
  discriminator.Add<Linear<>> (discriminatorHiddenLayerSize * 2, discriminatorHiddenLayerSize * 2);
  discriminator.Add<ReLULayer<>>();
  discriminator.Add<Linear<>> (discriminatorHiddenLayerSize * 2, discriminatorHiddenLayerSize * 2);
  discriminator.Add<ReLULayer<>>();
  discriminator.Add<Linear<>> (discriminatorHiddenLayerSize * 2, 1);
  discriminator.Add<SigmoidLayer<>>();
  // Create the Generator network
  FFN<CrossEntropyError<>> generator;
  generator.Add<Linear<>>(noiseDim, generatorHiddenLayerSize);
  generator.Add<SoftPlusLayer<>>();
  generator.Add<Linear<>>(generatorHiddenLayerSize, generatorOutputSize);

  AdamBatchSGD optimizer(batchSize, stepSize, numIterations, tolerance, shuffle);

  // Create Gan
  GaussianInitialization gaussian(0, 0.1);
  std::function<double ()> noiseFunction = [] () { return math::Random(-8, 8) + math::RandNormal(0, 1) * 0.01;};
  GAN<FFN<CrossEntropyError<>>, GaussianInitialization, std::function<double ()>>
  gan(trainData, generator, discriminator, gaussian, noiseFunction,
      noiseDim, batchSize, generatorUpdateStep, discriminatorPreTrain);
  Log::Info << "Training..." << std::endl;
  gan.Train(optimizer);
  gan.Parameters().save("preTrainedGAN.arm", arma::raw_binary);
  generator.Parameters().save("generatorParams", arma::raw_binary);
  // Generate samples
  Log::Info << "Sampling..." << std::endl;
  arma::mat noise(noiseDim, 1);
  size_t dim = std::sqrt(trainData.n_rows);
  arma::mat generatedData(2 * dim, dim * numSamples);
  for (size_t i = 0; i < numSamples; i++)
  {
    arma::mat samples;
    noise.imbue( [&]() { return noiseFunction(); } );

    generator.Forward(noise, samples);

    samples.reshape(dim, dim);
    samples = samples.t();

    generatedData.submat(0, i * dim, dim - 1, i * dim + dim - 1) = samples;


    samples = trainData.col(math::RandInt(0, trainData.n_cols));
    samples.reshape(dim, dim);
    samples = samples.t();

    generatedData.submat(dim, i * dim, 2 * dim - 1, i * dim + dim - 1) = samples;
  }

  Log::Info << "Saving output to " << output_dataset << "..." << std::endl;
  generatedData.save(output_dataset, arma::raw_ascii);
  Log::Info << "Output saved!" << std::endl;

  return 0;
}

## gan_keras.cpp
#include <mlpack/core.hpp>
#include <mlpack/core/util/cli.hpp>

#include <mlpack/methods/ann/init_rules/gaussian_init.hpp>
#include <mlpack/methods/ann/gan.hpp>
#include <mlpack/methods/softmax_regression/softmax_regression.hpp>
#include <mlpack/core/optimizers/minibatch_sgd/minibatch_sgd.hpp>

using namespace mlpack;
using namespace mlpack::ann;
using namespace mlpack::math;
using namespace mlpack::optimization;
using namespace mlpack::regression;
using namespace std::placeholders;

PROGRAM_INFO("GAN", "DIGITS");
PARAM_STRING_IN("dataset", "path/to/dataset.", "i", "mnist.arm");
PARAM_STRING_IN("output-dataset", "path/to/output.", "o", "output.txt");

PARAM_INT_IN("dataset-max-cols", "dataset max cols.", "m",  -1);

PARAM_INT_IN("generator-hidden-layer-size", "hidden layer size.", "G",  128);
PARAM_INT_IN("discriminator-hidden-layer-size", "hidden layer size.", "D",  128);
PARAM_INT_IN("discriminator-pre-train", "discriminator-pre-train", "x", 0);

PARAM_INT_IN("batch-size", "batch-size.", "b", 100);

PARAM_INT_IN("generator-update-step", "generator-update-step.", "g", 100);
PARAM_INT_IN("noise-dim", "noise dim.", "N", 25);
PARAM_INT_IN("num-samples", "num samples.", "n", 10);
PARAM_DOUBLE_IN("step-size", "learning rate.", "r", 0.01);
PARAM_INT_IN("num-epoches", "num-epoches.", "e", 20);
PARAM_DOUBLE_IN("tolerance", "tolerance.", "t", 1e-5);
PARAM_FLAG("shuffle", "shuffle or not", "s");

int main(int argc, char* argv[])
{
  CLI::ParseCommandLine(argc, argv);
  size_t generatorHiddenLayerSize = 64;
  size_t discriminatorHiddenLayerSize = 64;
  size_t generatorOutputSize;
  size_t discriminatorOutputSize = 1;
  size_t discriminatorPreTrain = 0;
  size_t batchSize = 20;
  size_t noiseDim = 30;
  size_t generatorUpdateStep = 2;
  size_t numSamples = 10;
  double stepSize = 1e-4;
  double beta1 = 0.9;
  double beta2 = 0.999;
  double eps = 1e-8;
  size_t numEpoches = 5;
  double tolerance = 1e-5;
  int datasetMaxCols = -1;
  bool shuffle = true;

  // Load the dataset
  arma::mat trainData;

  if (!CLI::HasParam("dataset"))
    Log::Fatal << "Input dataset is undefined!" << std::endl;

  if (!CLI::HasParam("output-dataset"))
    Log::Fatal << "Output dataset is undefined!" << std::endl;

  std::string dataset = CLI::GetParam<std::string>("dataset");
  std::string output_dataset = CLI::GetParam<std::string>("output-dataset");

  if (CLI::HasParam("dataset-max-cols"))
    datasetMaxCols = CLI::GetParam<int>("dataset-max-cols");

  if (CLI::HasParam("generator-hidden-layer-size"))
    generatorHiddenLayerSize = CLI::GetParam<int>("generator-hidden-layer-size");

  if (CLI::HasParam("discriminator-hidden-layer-size"))
    discriminatorHiddenLayerSize = CLI::GetParam<int>("discriminator-hidden-layer-size");

  if (CLI::HasParam("batch-size"))
    batchSize = CLI::GetParam<int>("batch-size");

  if (CLI::HasParam("generator-update-step"))
    generatorUpdateStep = CLI::GetParam<int>("generator-update-step");

  if (CLI::HasParam("noise-dim"))
    noiseDim = CLI::GetParam<int>("noise-dim");

  if (CLI::HasParam("num-samples"))
    numSamples = CLI::GetParam<int>("num-samples");

  if (CLI::HasParam("step-size"))
    stepSize = CLI::GetParam<double>("step-size");

  if (CLI::HasParam("num-epoches"))
    numEpoches = CLI::GetParam<int>("num-epoches");

  if (CLI::HasParam("tolerance"))
    tolerance = CLI::GetParam<double>("tolerance");

  shuffle = CLI::HasParam("shuffle");

  Log::Info << "dataset = '" << dataset << "'" << std::endl;
  Log::Info << "output_dataset = '" << output_dataset << "'" << std::endl;
  Log::Info << std::boolalpha
      << "generatorHiddenLayerSize = " << generatorHiddenLayerSize
      << " discriminatorHiddenLayerSize = " << discriminatorHiddenLayerSize
      << " batchSize = " << batchSize
      << " generatorUpdateStep = " << generatorUpdateStep
      << " noiseDim = " << noiseDim
      << " numSamples = " << numSamples
      << " stepSize = " << stepSize
      << " numEpoches = " << numEpoches
      << " tolerance = " << tolerance
      << " shuffle = " << shuffle << std::endl;

  Log::Info << "Loading dataset '" << dataset << "'..." << std::endl;
  trainData.load(dataset);

  if (datasetMaxCols > 0)
    trainData = trainData.cols(0, datasetMaxCols - 1);

  Log::Info << "Dataset loaded (" << trainData.n_rows << ", " << trainData.n_cols << ")" << std::endl;
  generatorOutputSize = trainData.n_rows;

  // Discriminator Network
  FFN<CrossEntropyError<>> discriminator;
  discriminator.Add<Linear<>>(trainData.n_rows, discriminatorHiddenLayerSize);
  discriminator.Add<LeakyReLU<>>(0.2);
  discriminator.Add<Linear<>>(discriminatorHiddenLayerSize, discriminatorHiddenLayerSize / 2);
  discriminator.Add<LeakyReLU<>>(0.2);
  discriminator.Add<Linear<>>(discriminatorHiddenLayerSize / 2, discriminatorHiddenLayerSize / 4);
  discriminator.Add<LeakyReLU<>>(0.2);
  discriminator.Add<Linear<>>(discriminatorHiddenLayerSize / 4, discriminatorOutputSize);
  discriminator.Add<SigmoidLayer<>>();

  // Generator network
  FFN<CrossEntropyError<>> generator;
  generator.Add<Linear<>>(noiseDim, generatorHiddenLayerSize / 4);
  generator.Add<LeakyReLU<>>(0.2);
  generator.Add<Linear<>>(generatorHiddenLayerSize / 4, generatorHiddenLayerSize / 2);
  generator.Add<LeakyReLU<>>(0.2);
  generator.Add<Linear<>>(generatorHiddenLayerSize / 2, generatorOutputSize);
  generator.Add<SigmoidLayer<>>();

  // Intialisation function
  RandomInitialization random(-0.05, 0.05);
  // Optimizer

  size_t numIterations = trainData.n_cols * numEpoches;
  numIterations /= batchSize;
  Log::Info << numIterations << std::endl;

  AdamBatchSGD optimizer(batchSize, stepSize, numIterations, tolerance, shuffle);
  std::function<double ()> noiseFunction = [] () { return math::Random(0, 1); };
  // GAN model
  GAN<FFN<CrossEntropyError<>>, RandomInitialization, std::function<double ()> > gan(trainData, generator, discriminator, random, noiseFunction, noiseDim,
      batchSize, generatorUpdateStep, discriminatorPreTrain);

  Log::Info << "Training..." << std::endl;
  gan.Train(optimizer);

  // Generate samples
  Log::Info << "Sampling..." << std::endl;
  arma::mat noise(noiseDim, 1);
  size_t dim = std::sqrt(trainData.n_rows);
  arma::mat generatedData(2 * dim, dim * numSamples);
  for (size_t i = 0; i < numSamples; i++)
  {
    arma::mat samples;
    noise.imbue( [&]() { return math::Random(0, 1); } );
    generator.Forward(noise, samples);

    samples.reshape(dim, dim);
    samples = samples.t();

    generatedData.submat(0, i * dim, dim - 1, i * dim + dim - 1) = samples;


    samples = trainData.col(math::RandInt(0, trainData.n_cols));
    samples.reshape(dim, dim);
    samples = samples.t();

    generatedData.submat(dim, i * dim, 2 * dim - 1, i * dim + dim - 1) = samples;
  }

  Log::Info << "Saving output to " << output_dataset << "..." << std::endl;
  generatedData.save(output_dataset, arma::raw_ascii);
  Log::Info << "Output saved!" << std::endl;

  return 0;

}
	#include <mlpack/core.hpp>
	#include <mlpack/core/util/cli.hpp>

	#include <mlpack/methods/ann/init_rules/gaussian_init.hpp>
	#include <mlpack/methods/ann/layer/layer_types.hpp>
	#include <mlpack/methods/ann/layer/layer.hpp>
	#include <mlpack/methods/ann/gan.hpp>
	#include <mlpack/methods/softmax_regression/softmax_regression.hpp>
	#include <mlpack/core/optimizers/minibatch_sgd/minibatch_sgd.hpp>

	using namespace mlpack;
	using namespace mlpack::ann;
	using namespace mlpack::math;
	using namespace mlpack::optimization;
	using namespace mlpack::regression;

	PROGRAM_INFO("GAN", "Convolution");
	PARAM_STRING_IN("dataset", "path/to/dataset.", "i", "mnist.arm");
	PARAM_STRING_IN("output-dataset", "path/to/output.", "o", "output.txt");

	PARAM_INT_IN("dataset-max-cols", "dataset max cols.", "m", -1);
	PARAM_INT_IN("batch-size", "batch-size.", "b", 100);
	PARAM_INT_IN("generator-update-step", "generator-update-step.", "g", 100);
	PARAM_INT_IN("discriminatorPreTrain", "discriminatorPreTrain", "x", 0);
	PARAM_INT_IN("dNumKernels", "dNumKernels", "k", 32);
	PARAM_INT_IN("noise-dim", "noise dim.", "N", 25);
	PARAM_INT_IN("num-samples", "num samples.", "n", 1000);
	PARAM_DOUBLE_IN("step-size", "learning rate.", "r", 0.01);
	PARAM_INT_IN("num-epoches", "num-epoches.", "e", 20);
	PARAM_DOUBLE_IN("tolerance", "tolerance.", "t", 1e-5);
	PARAM_FLAG("shuffle", "shuffle or not", "s");



	int main(int argc, char* argv[])
	{
	/*
	#ifdef LOCAL
	freopen("output.txt", "w", stdout);
	#endif
	*/
	// We treat the archtitechture as constant.
	CLI::ParseCommandLine(argc, argv);

	size_t dNumKernels = 32;
	size_t discriminatorPreTrain = 300;
	size_t batchSize = 50;
	size_t noiseDim = 10;
	size_t generatorUpdateStep = 1;
	size_t numSamples = 10;
	double stepSize = 0.0003;
	double eps = 1e-8;
	size_t numEpoches = 2000;
	double tolerance = 1e-5;
	int datasetMaxCols = -1;
	bool shuffle = true;
	double multiplier = 10;

	std::string dataset = CLI::GetParam<std::string>("dataset");
	std::string output_dataset = CLI::GetParam<std::string>("output-dataset");

	if (CLI::HasParam("dataset-max-cols"))
	datasetMaxCols = CLI::GetParam<int>("dataset-max-cols");

	if (CLI::HasParam("batch-size"))
	batchSize = CLI::GetParam<int>("batch-size");

	if (CLI::HasParam("generator-update-step"))
	generatorUpdateStep = CLI::GetParam<int>("generator-update-step");

	if (CLI::HasParam("noise-dim"))
	noiseDim = CLI::GetParam<int>("noise-dim");

	if (CLI::HasParam("num-samples"))
	numSamples = CLI::GetParam<int>("num-samples");

	if (CLI::HasParam("step-size"))
	stepSize = CLI::GetParam<double>("step-size");

	if (CLI::HasParam("num-epoches"))
	numEpoches = CLI::GetParam<int>("num-epoches");

	if (CLI::HasParam("tolerance"))
	tolerance = CLI::GetParam<double>("tolerance");

	if (CLI::HasParam("discriminatorPreTrain"))
	discriminatorPreTrain = CLI::GetParam<int>("discriminatorPreTrain");

	shuffle = CLI::HasParam("shuffle");

	Log::Info << "dataset = '" << dataset << "'" << std::endl;
	Log::Info << "output_dataset = '" << output_dataset << "'" << std::endl;
	Log::Info << std::boolalpha
	<< " batchSize = " << batchSize
	<< " generatorUpdateStep = " << generatorUpdateStep
	<< " noiseDim = " << noiseDim
	<< " numSamples = " << numSamples
	<< " stepSize = " << stepSize
	<< " numEpoches = " << numEpoches
	<< " tolerance = " << tolerance
	<< " shuffle = " << shuffle << std::endl;

	arma::mat trainData;
	trainData.load(dataset);

	if (datasetMaxCols > 0)
	trainData = trainData.cols(0, datasetMaxCols - 1);

	Log::Info << "Dataset loaded (" << trainData.n_rows << ", " << trainData.n_cols << ")" << std::endl;

	size_t numIterations = trainData.n_cols * numEpoches;
	numIterations /= batchSize;

	Log::Info << trainData.n_rows << "--------" << trainData.n_cols << std::endl;

	// Discriminator Network
	FFN<CrossEntropyErrorLogits<>> discriminator;
	discriminator.Add<Convolution<>>(1, dNumKernels, 5, 5, 1, 1, 2, 2, 28, 28);
	discriminator.Add<ReLULayer<>>();
	discriminator.Add<MeanPooling<>>(2, 2, 2, 2);
	discriminator.Add<Convolution<>>(dNumKernels, 2 * dNumKernels, 5, 5, 1, 1, 2, 2, 14, 14);
	discriminator.Add<ReLULayer<>>();
	discriminator.Add<MeanPooling<>>(2, 2, 2, 2);
	discriminator.Add<Linear<>>(7 * 7 * 2 * dNumKernels, 1024);
	discriminator.Add<ReLULayer<>>();
	discriminator.Add<Linear<>>(1024, 1);


	BiLinearFunction interpolation1(28, 28, 56, 56 , noiseDim / 2);
	BiLinearFunction interpolation2(28, 28, 56, 56 , noiseDim / 4);

	// Generator Network
	FFN<CrossEntropyErrorLogits<>> generator;
	generator.Add<Linear<>>(noiseDim, 3136);
	generator.Add<ReLULayer<>>();
	generator.Add<Convolution<>>(1, noiseDim / 2, 3, 3, 2, 2, 1, 1, 56, 56);
	generator.Add<ReLULayer<>>();
	generator.Add<Resize<> >(interpolation1);
	generator.Add<Convolution<>>(noiseDim / 2, noiseDim / 4, 3, 3, 2, 2, 1, 1, 56, 56);
	generator.Add<ReLULayer<>>();
	generator.Add<Resize<> >(interpolation2);
	generator.Add<Convolution<>>(noiseDim / 4, 1, 3, 3, 2, 2, 1, 1, 56, 56);
	generator.Add<ReLULayer<>>();
	generator.Add<SigmoidLayer<>>();

	// Intialisation function
	GaussianInitialization gaussian(0, 1);
	// Optimizer
	AdamBatchSGD optimizer(batchSize, stepSize, numIterations, tolerance, shuffle);

	std::function<double ()> noiseFunction = [] () { return math::RandNormal(0, 1);};

	// Train Gan with preTrain step size 300

	GAN<FFN<CrossEntropyErrorLogits<>>, GaussianInitialization, std::function<double ()>>
	gan(trainData, generator, discriminator, gaussian, noiseFunction,
	noiseDim, batchSize, generatorUpdateStep, discriminatorPreTrain,
	multiplier);

	Log::Info << "Training..." << std::endl;
	// std::cout << "Train" << std::endl;
	gan.Train(optimizer);

	// Generate samples
	Log::Info << "Sampling..." << std::endl;
	arma::mat noise(noiseDim, 1);
	size_t dim = std::sqrt(trainData.n_rows);
	arma::mat generatedData(2 * dim, dim * numSamples);
	for (size_t i = 0; i < numSamples; i++)
	{
	arma::mat samples;
	noise.imbue( [&]() { return noiseFunction(); } );
	generator.Forward(noise, samples);

	samples.reshape(dim, dim);
	samples = samples.t();

	generatedData.submat(0, i * dim, dim - 1, i * dim + dim - 1) = samples;


	samples = trainData.col(math::RandInt(0, trainData.n_cols));
	samples.reshape(dim, dim);
	samples = samples.t();

	generatedData.submat(dim, i * dim, 2 * dim - 1, i * dim + dim - 1) = samples;
	}

	Log::Info << "Saving output to " << output_dataset << "..." << std::endl;
	generatedData.save(output_dataset, arma::raw_ascii);
	Log::Info << "Output saved!" << std::endl;
	}