plankes-projects/DeepLearning4J.java

## DeepLearning4J.java
package DeepLearning4J.example

import java.io.File;
import java.util.Arrays;
import java.util.List;

import org.canova.api.records.reader.RecordReader;
import org.canova.api.split.FileSplit;
import org.canova.image.loader.BaseImageLoader;
import org.canova.image.loader.NativeImageLoader;
import org.canova.image.recordreader.ImageRecordReader;
import org.deeplearning4j.datasets.canova.RecordReaderDataSetIterator;
import org.deeplearning4j.datasets.iterator.DataSetIterator;
import org.deeplearning4j.eval.Evaluation;
import org.deeplearning4j.nn.api.OptimizationAlgorithm;
import org.deeplearning4j.nn.conf.GradientNormalization;
import org.deeplearning4j.nn.conf.MultiLayerConfiguration;
import org.deeplearning4j.nn.conf.NeuralNetConfiguration;
import org.deeplearning4j.nn.conf.Updater;
import org.deeplearning4j.nn.conf.layers.ConvolutionLayer;
import org.deeplearning4j.nn.conf.layers.DenseLayer;
import org.deeplearning4j.nn.conf.layers.LocalResponseNormalization;
import org.deeplearning4j.nn.conf.layers.OutputLayer;
import org.deeplearning4j.nn.conf.layers.SubsamplingLayer;
import org.deeplearning4j.nn.multilayer.MultiLayerNetwork;
import org.deeplearning4j.nn.weights.WeightInit;
import org.deeplearning4j.optimize.listeners.ScoreIterationListener;
import org.nd4j.linalg.api.ndarray.INDArray;
import org.nd4j.linalg.dataset.DataSet;
import org.nd4j.linalg.lossfunctions.LossFunctions;

public class DeepLearning4J {
	/*
 	Maven dependencies:

	<dependency>
		<groupId>org.deeplearning4j</groupId>
		<artifactId>deeplearning4j-core</artifactId>
		<version>0.4-rc3.9</version>
	</dependency>

	<dependency>
		<artifactId>canova-api</artifactId>
		<groupId>org.nd4j</groupId>
		<version>0.4-rc3.9</version>
	</dependency>

	<dependency>
		<groupId>org.nd4j</groupId>
		<artifactId>nd4j-native</artifactId>
		<version>0.4-rc3.9</version>
	</dependency>

 */
	public static void main(String[] args) throws Exception {
		int imageWidth = 100;
		int imageHeight = 100;
		int channels = 3;

		// create dataset
		// Directory which has 1 sub-directory with images for each category you have.
		File directory = new File("path/to/basedirectory");
		int batchSize = 50;
		boolean appendLabels = true;
		List<String> labels = Arrays.asList(directory.list());
		int numLabels = labels.size();

		RecordReader recordReader = new ImageRecordReader(imageWidth, imageHeight, channels, appendLabels);
		recordReader.initialize(new FileSplit(directory, BaseImageLoader.ALLOWED_FORMATS));
		DataSetIterator dataIter = new RecordReaderDataSetIterator(recordReader, batchSize, -1, numLabels);

		// setup model
		MultiLayerNetwork model = new MultiLayerNetwork(buildConfig(imageWidth, imageHeight, channels, numLabels));
		model.init();
		model.setListeners(new ScoreIterationListener(1));

		// train model
		int epochs = 5;
		for (int i = 0; i < epochs; i++) {
			dataIter.reset();
			model.fit(dataIter);
		}

		// test model
		// You can also call eval.eval(realOutcome, prediction); with you ownr prediction method.
		// Call your own prediction method with every trained image
		// than you can be sure the printed stats are correct
		// because in my case, it was different...
		dataIter.reset();
		Evaluation eval = new Evaluation(dataIter.getLabels());
		while (dataIter.hasNext()) {
			DataSet next = dataIter.next();
			INDArray prediction = model.output(next.getFeatureMatrix());
			eval.eval(next.getLabels(), prediction);
		}
		System.out.println(eval.stats());

		// predict new image
		File imageToPredict = new File("predictMe.jpg");
		NativeImageLoader imageLoader = new NativeImageLoader(imageWidth, imageHeight, channels);
		INDArray imageVector = imageLoader.asRowVector(imageToPredict);
		INDArray prediction = model.output(imageVector, false);
		// prediction contains one float for every label you have, sums up to 1
	}

	static private MultiLayerConfiguration buildConfig(int imageWidth, int imageHeight, int channels, int numOfClasses) {
		int seed = 123;
		int iterations = 1;

		WeightInit weightInit = WeightInit.XAVIER;
		String activation = "relu";
		Updater updater = Updater.NESTEROVS;
		double lr = 1e-3;
		double mu = 0.9;
		double l2 = 5e-4;
		boolean regularization = true;

		SubsamplingLayer.PoolingType poolingType = SubsamplingLayer.PoolingType.MAX;
		double nonZeroBias = 1;
		double dropOut = 0.5;

		MultiLayerConfiguration.Builder builder = new NeuralNetConfiguration.Builder().seed(seed).iterations(iterations).activation(activation).weightInit(weightInit)
				.gradientNormalization(GradientNormalization.RenormalizeL2PerLayer).optimizationAlgo(OptimizationAlgorithm.STOCHASTIC_GRADIENT_DESCENT).learningRate(lr).momentum(mu)
				.regularization(regularization).l2(l2).updater(updater).useDropConnect(true)

				// AlexNet
				.list().layer(0, new ConvolutionLayer.Builder(new int[] { 11, 11 }, new int[] { 4, 4 }, new int[] { 3, 3 }).name("cnn1").nIn(channels).nOut(96).build())
				.layer(1, new LocalResponseNormalization.Builder().name("lrn1").build())
				.layer(2, new SubsamplingLayer.Builder(poolingType, new int[] { 3, 3 }, new int[] { 2, 2 }).name("maxpool1").build())
				.layer(3, new ConvolutionLayer.Builder(new int[] { 5, 5 }, new int[] { 1, 1 }, new int[] { 2, 2 }).name("cnn2").nOut(256).biasInit(nonZeroBias).build())
				.layer(4, new LocalResponseNormalization.Builder().name("lrn2").k(2).n(5).alpha(1e-4).beta(0.75).build())
				.layer(5, new SubsamplingLayer.Builder(poolingType, new int[] { 3, 3 }, new int[] { 2, 2 }).name("maxpool2").build())
				.layer(6, new ConvolutionLayer.Builder(new int[] { 3, 3 }, new int[] { 1, 1 }, new int[] { 1, 1 }).name("cnn3").nOut(384).build())
				.layer(7, new ConvolutionLayer.Builder(new int[] { 3, 3 }, new int[] { 1, 1 }, new int[] { 1, 1 }).name("cnn4").nOut(384).biasInit(nonZeroBias).build())
				.layer(8, new ConvolutionLayer.Builder(new int[] { 3, 3 }, new int[] { 1, 1 }, new int[] { 1, 1 }).name("cnn5").nOut(256).biasInit(nonZeroBias).build())
				.layer(9, new SubsamplingLayer.Builder(poolingType, new int[] { 3, 3 }, new int[] { 2, 2 }).name("maxpool3").build())
				.layer(10, new DenseLayer.Builder().name("ffn1").nOut(4096).biasInit(nonZeroBias).dropOut(dropOut).build())
				.layer(11, new DenseLayer.Builder().name("ffn2").nOut(4096).biasInit(nonZeroBias).dropOut(dropOut).build())
				.layer(12, new OutputLayer.Builder(LossFunctions.LossFunction.NEGATIVELOGLIKELIHOOD).name("output").nOut(numOfClasses).activation("softmax").build()).backprop(true).pretrain(false)
				.cnnInputSize(imageHeight, imageWidth, channels);

		return builder.build();
	}
}
	package DeepLearning4J.example

	import java.io.File;
	import java.util.Arrays;
	import java.util.List;

	import org.canova.api.records.reader.RecordReader;
	import org.canova.api.split.FileSplit;
	import org.canova.image.loader.BaseImageLoader;
	import org.canova.image.loader.NativeImageLoader;
	import org.canova.image.recordreader.ImageRecordReader;
	import org.deeplearning4j.datasets.canova.RecordReaderDataSetIterator;
	import org.deeplearning4j.datasets.iterator.DataSetIterator;
	import org.deeplearning4j.eval.Evaluation;
	import org.deeplearning4j.nn.api.OptimizationAlgorithm;
	import org.deeplearning4j.nn.conf.GradientNormalization;
	import org.deeplearning4j.nn.conf.MultiLayerConfiguration;
	import org.deeplearning4j.nn.conf.NeuralNetConfiguration;
	import org.deeplearning4j.nn.conf.Updater;
	import org.deeplearning4j.nn.conf.layers.ConvolutionLayer;
	import org.deeplearning4j.nn.conf.layers.DenseLayer;
	import org.deeplearning4j.nn.conf.layers.LocalResponseNormalization;
	import org.deeplearning4j.nn.conf.layers.OutputLayer;
	import org.deeplearning4j.nn.conf.layers.SubsamplingLayer;
	import org.deeplearning4j.nn.multilayer.MultiLayerNetwork;
	import org.deeplearning4j.nn.weights.WeightInit;
	import org.deeplearning4j.optimize.listeners.ScoreIterationListener;
	import org.nd4j.linalg.api.ndarray.INDArray;
	import org.nd4j.linalg.dataset.DataSet;
	import org.nd4j.linalg.lossfunctions.LossFunctions;

	public class DeepLearning4J {
	/*
	Maven dependencies:

	<dependency>
	<groupId>org.deeplearning4j</groupId>
	<artifactId>deeplearning4j-core</artifactId>
	<version>0.4-rc3.9</version>
	</dependency>

	<dependency>
	<artifactId>canova-api</artifactId>
	<groupId>org.nd4j</groupId>
	<version>0.4-rc3.9</version>
	</dependency>

	<dependency>
	<groupId>org.nd4j</groupId>
	<artifactId>nd4j-native</artifactId>
	<version>0.4-rc3.9</version>
	</dependency>

	*/
	public static void main(String[] args) throws Exception {
	int imageWidth = 100;
	int imageHeight = 100;
	int channels = 3;

	// create dataset
	// Directory which has 1 sub-directory with images for each category you have.
	File directory = new File("path/to/basedirectory");
	int batchSize = 50;
	boolean appendLabels = true;
	List<String> labels = Arrays.asList(directory.list());
	int numLabels = labels.size();

	RecordReader recordReader = new ImageRecordReader(imageWidth, imageHeight, channels, appendLabels);
	recordReader.initialize(new FileSplit(directory, BaseImageLoader.ALLOWED_FORMATS));
	DataSetIterator dataIter = new RecordReaderDataSetIterator(recordReader, batchSize, -1, numLabels);

	// setup model
	MultiLayerNetwork model = new MultiLayerNetwork(buildConfig(imageWidth, imageHeight, channels, numLabels));
	model.init();
	model.setListeners(new ScoreIterationListener(1));

	// train model
	int epochs = 5;
	for (int i = 0; i < epochs; i++) {
	dataIter.reset();
	model.fit(dataIter);
	}

	// test model
	// You can also call eval.eval(realOutcome, prediction); with you ownr prediction method.
	// Call your own prediction method with every trained image
	// than you can be sure the printed stats are correct
	// because in my case, it was different...
	dataIter.reset();
	Evaluation eval = new Evaluation(dataIter.getLabels());
	while (dataIter.hasNext()) {
	DataSet next = dataIter.next();
	INDArray prediction = model.output(next.getFeatureMatrix());
	eval.eval(next.getLabels(), prediction);
	}
	System.out.println(eval.stats());

	// predict new image
	File imageToPredict = new File("predictMe.jpg");
	NativeImageLoader imageLoader = new NativeImageLoader(imageWidth, imageHeight, channels);
	INDArray imageVector = imageLoader.asRowVector(imageToPredict);
	INDArray prediction = model.output(imageVector, false);
	// prediction contains one float for every label you have, sums up to 1
	}

	static private MultiLayerConfiguration buildConfig(int imageWidth, int imageHeight, int channels, int numOfClasses) {
	int seed = 123;
	int iterations = 1;

	WeightInit weightInit = WeightInit.XAVIER;
	String activation = "relu";
	Updater updater = Updater.NESTEROVS;
	double lr = 1e-3;
	double mu = 0.9;
	double l2 = 5e-4;
	boolean regularization = true;

	SubsamplingLayer.PoolingType poolingType = SubsamplingLayer.PoolingType.MAX;
	double nonZeroBias = 1;
	double dropOut = 0.5;

	MultiLayerConfiguration.Builder builder = new NeuralNetConfiguration.Builder().seed(seed).iterations(iterations).activation(activation).weightInit(weightInit)
	.gradientNormalization(GradientNormalization.RenormalizeL2PerLayer).optimizationAlgo(OptimizationAlgorithm.STOCHASTIC_GRADIENT_DESCENT).learningRate(lr).momentum(mu)
	.regularization(regularization).l2(l2).updater(updater).useDropConnect(true)

	// AlexNet
	.list().layer(0, new ConvolutionLayer.Builder(new int[] { 11, 11 }, new int[] { 4, 4 }, new int[] { 3, 3 }).name("cnn1").nIn(channels).nOut(96).build())
	.layer(1, new LocalResponseNormalization.Builder().name("lrn1").build())
	.layer(2, new SubsamplingLayer.Builder(poolingType, new int[] { 3, 3 }, new int[] { 2, 2 }).name("maxpool1").build())
	.layer(3, new ConvolutionLayer.Builder(new int[] { 5, 5 }, new int[] { 1, 1 }, new int[] { 2, 2 }).name("cnn2").nOut(256).biasInit(nonZeroBias).build())
	.layer(4, new LocalResponseNormalization.Builder().name("lrn2").k(2).n(5).alpha(1e-4).beta(0.75).build())
	.layer(5, new SubsamplingLayer.Builder(poolingType, new int[] { 3, 3 }, new int[] { 2, 2 }).name("maxpool2").build())
	.layer(6, new ConvolutionLayer.Builder(new int[] { 3, 3 }, new int[] { 1, 1 }, new int[] { 1, 1 }).name("cnn3").nOut(384).build())
	.layer(7, new ConvolutionLayer.Builder(new int[] { 3, 3 }, new int[] { 1, 1 }, new int[] { 1, 1 }).name("cnn4").nOut(384).biasInit(nonZeroBias).build())
	.layer(8, new ConvolutionLayer.Builder(new int[] { 3, 3 }, new int[] { 1, 1 }, new int[] { 1, 1 }).name("cnn5").nOut(256).biasInit(nonZeroBias).build())
	.layer(9, new SubsamplingLayer.Builder(poolingType, new int[] { 3, 3 }, new int[] { 2, 2 }).name("maxpool3").build())
	.layer(10, new DenseLayer.Builder().name("ffn1").nOut(4096).biasInit(nonZeroBias).dropOut(dropOut).build())
	.layer(11, new DenseLayer.Builder().name("ffn2").nOut(4096).biasInit(nonZeroBias).dropOut(dropOut).build())
	.layer(12, new OutputLayer.Builder(LossFunctions.LossFunction.NEGATIVELOGLIKELIHOOD).name("output").nOut(numOfClasses).activation("softmax").build()).backprop(true).pretrain(false)
	.cnnInputSize(imageHeight, imageWidth, channels);

	return builder.build();
	}
	}