thomasjpfan/how_to_run.md

## how_to_run.md

      
    Raw
  

              how_to_run.md
            
          
    python -m cProfile -o skorch.prof skorch_bm.py
Install and run snackviz
pip install snakeviz
snackviz skorch.prof

For completeness the pure torch implementation can be tested:
python -m cProfile -o torch.prof torch_bm.py
snackviz torch.prof

  
## skorch_bm.py
import argparse
import os

from sklearn.datasets import fetch_mldata
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score
from sklearn.utils import shuffle
from skorch import NeuralNetClassifier
from skorch.callbacks import EpochScoring
import torch
import time
from torch import nn

BATCH_SIZE = 128
DATA_HOME = os.path.join(os.getcwd(), 'examples', 'datasets')
LEARNING_RATE = 0.1
MAX_EPOCHS = 12


def get_data(num_samples, data_home):
    mnist = fetch_mldata('MNIST original', data_home=data_home)
    torch.manual_seed(0)
    X = mnist.data.astype('float32').reshape(-1, 1, 28, 28)
    y = mnist.target.astype('int64')
    X, y = shuffle(X, y)
    X, y = X[:num_samples], y[:num_samples]
    X_train, X_test, y_train, y_test = train_test_split(
        X, y, stratify=y, random_state=0)
    X_train /= 255
    X_test /= 255
    return X_train, X_test, y_train, y_test


class ClassifierModule(nn.Module):
    def __init__(self):
        super(ClassifierModule, self).__init__()

        self.cnn = nn.Sequential(
            nn.Conv2d(1, 32, (3, 3)),
            nn.ReLU(),
            nn.Conv2d(32, 64, (3, 3)),
            nn.ReLU(),
            nn.MaxPool2d((2, 2)),
            nn.Dropout(0.25),
        )
        self.out = nn.Sequential(
            nn.Linear(64 * 12 * 12, 128),
            nn.ReLU(),
            nn.Dropout(0.5),
            nn.Linear(128, 10),
            nn.Softmax(dim=-1),
        )

    def forward(self, X, **kwargs):
        X = self.cnn(X)
        X = X.reshape(-1, 64 * 12 * 12)
        X = self.out(X)
        return X


def performance_skorch(
        X_train,
        X_test,
        y_train,
        y_test,
        batch_size,
        device,
        lr,
        max_epochs,
):
    torch.manual_seed(0)
    net = NeuralNetClassifier(
        ClassifierModule,
        batch_size=batch_size,
        optimizer=torch.optim.Adadelta,
        lr=lr,
        device=device,
        max_epochs=max_epochs,
        callbacks=[
            ('tr_acc',
             EpochScoring(
                 'accuracy',
                 lower_is_better=False,
                 on_train=True,
                 name='train_acc',
             )),
        ],
    )
    net.fit(X_train, y_train)
    y_pred = net.predict(X_test)
    score = accuracy_score(y_test, y_pred)
    return score


def main(device, num_samples):
    data = get_data(num_samples, DATA_HOME)
    # trigger potential cuda call overhead
    torch.zeros(1).to(device)

    tic = time.time()
    performance_skorch(
        *data,
        batch_size=BATCH_SIZE,
        max_epochs=MAX_EPOCHS,
        lr=LEARNING_RATE,
        device=device,
    )
    print("Time: {:.4f}".format(time.time() -tic))


if __name__ == '__main__':
    parser = argparse.ArgumentParser(description="skorch MNIST benchmark")
    parser.add_argument(
        '--device',
        type=str,
        default='cuda',
        help='device (e.g. "cuda", "cpu")')
    parser.add_argument(
        '--num_samples',
        type=int,
        default=20000,
        help='total number of samples to use')
    args = parser.parse_args()
    main(device=args.device, num_samples=args.num_samples)

## torch_bm.py
import argparse
import os
import time

import numpy as np
from sklearn.datasets import fetch_mldata
from sklearn.model_selection import train_test_split
from sklearn.model_selection import StratifiedKFold
from sklearn.metrics import accuracy_score
from sklearn.utils import shuffle
import torch
import torch.utils.data
from torch import nn

BATCH_SIZE = 128
DATA_HOME = os.path.join(os.getcwd(), 'examples', 'datasets')
LEARNING_RATE = 0.1
MAX_EPOCHS = 12


def get_data(num_samples, data_home):
    mnist = fetch_mldata('MNIST original', data_home=data_home)
    torch.manual_seed(0)
    X = mnist.data.astype('float32').reshape(-1, 1, 28, 28)
    y = mnist.target.astype('int64')
    X, y = shuffle(X, y)
    X, y = X[:num_samples], y[:num_samples]
    X_train, X_test, y_train, y_test = train_test_split(
        X, y, stratify=y, random_state=0)
    X_train /= 255
    X_test /= 255
    return X_train, X_test, y_train, y_test


class ClassifierModule(nn.Module):
    def __init__(self):
        super(ClassifierModule, self).__init__()

        self.cnn = nn.Sequential(
            nn.Conv2d(1, 32, (3, 3)),
            nn.ReLU(),
            nn.Conv2d(32, 64, (3, 3)),
            nn.ReLU(),
            nn.MaxPool2d((2, 2)),
            nn.Dropout(0.25),
        )
        self.out = nn.Sequential(
            nn.Linear(64 * 12 * 12, 128),
            nn.ReLU(),
            nn.Dropout(0.5),
            nn.Linear(128, 10),
            nn.Softmax(dim=-1),
        )

    def forward(self, X, **kwargs):
        X = self.cnn(X)
        X = X.reshape(-1, 64 * 12 * 12)
        X = self.out(X)
        return X


def report(losses, batch_sizes, y, y_proba, epoch, time, training=True):
    template = "{} | epoch {:>2} | "

    loss = np.average(losses, weights=batch_sizes)
    y_pred = np.argmax(y_proba, axis=1)
    acc = accuracy_score(y, y_pred)

    template += "acc: {:.4f} | loss: {:.4f} | time: {:.2f}"
    print(
        template.format('train'
                        if training else 'valid', epoch + 1, acc, loss, time))


def train_torch(
        model,
        X,
        X_test,
        y,
        y_test,
        batch_size,
        device,
        lr,
        max_epochs,
):
    model.to(device)

    idx_train, idx_valid = next(
        iter(StratifiedKFold(5, random_state=0).split(np.arange(len(X)), y)))
    X_train, X_valid, y_train, y_valid = (X[idx_train], X[idx_valid],
                                          y[idx_train], y[idx_valid])
    dataset_train = torch.utils.data.TensorDataset(
        torch.tensor(X_train),
        torch.tensor(y_train),
    )
    dataset_valid = torch.utils.data.TensorDataset(
        torch.tensor(X_valid),
        torch.tensor(y_valid),
    )

    optimizer = torch.optim.Adadelta(model.parameters(), lr=lr)
    criterion = nn.NLLLoss()

    for epoch in range(max_epochs):
        train_out = train_step(
            model,
            dataset_train,
            batch_size=batch_size,
            device=device,
            criterion=criterion,
            optimizer=optimizer,
        )
        report(y=y_train, epoch=epoch, training=True, **train_out)

        valid_out = valid_step(
            model,
            dataset_valid,
            batch_size=batch_size,
            device=device,
            criterion=criterion,
        )
        report(y=y_valid, epoch=epoch, training=False, **valid_out)

        print('-' * 50)

    return model


def train_step(model, dataset, device, criterion, batch_size, optimizer):
    model.train()
    y_preds = []
    losses = []
    batch_sizes = []
    tic = time.time()
    for Xi, yi in torch.utils.data.DataLoader(dataset, batch_size=batch_size):
        Xi, yi = Xi.to(device), yi.to(device)
        optimizer.zero_grad()
        y_pred = model(Xi)
        y_pred = torch.log(y_pred)
        loss = criterion(y_pred, yi)
        loss.backward()
        optimizer.step()

        y_preds.append(y_pred)
        losses.append(loss.item())
        batch_sizes.append(len(Xi))
    toc = time.time()
    return {
        'losses': losses,
        'batch_sizes': batch_sizes,
        'y_proba': torch.cat(y_preds).cpu().detach().numpy(),
        'time': toc - tic,
    }


def valid_step(model, dataset, device, criterion, batch_size):
    model.eval()
    y_preds = []
    losses = []
    batch_sizes = []
    tic = time.time()
    with torch.no_grad():
        for Xi, yi in torch.utils.data.DataLoader(
                dataset,
                batch_size=batch_size,
        ):
            Xi, yi = Xi.to(device), yi.to(device)
            y_pred = model(Xi)
            y_pred = torch.log(y_pred)
            loss = criterion(y_pred, yi)

            y_preds.append(y_pred)
            loss = loss.item()
            losses.append(loss)
            batch_sizes.append(len(Xi))
    toc = time.time()
    return {
        'losses': losses,
        'batch_sizes': batch_sizes,
        'y_proba': torch.cat(y_preds).cpu().detach().numpy(),
        'time': toc - tic,
    }


def performance_torch(
        X_train,
        X_test,
        y_train,
        y_test,
        batch_size,
        device,
        lr,
        max_epochs,
):
    torch.manual_seed(0)
    model = ClassifierModule()
    model = train_torch(
        model,
        X_train,
        X_test,
        y_train,
        y_test,
        batch_size=batch_size,
        device=device,
        max_epochs=max_epochs,
        lr=0.1,
    )

    X_test = torch.tensor(X_test).to(device)
    with torch.no_grad():
        y_pred = model(X_test).cpu().numpy().argmax(1)
    return accuracy_score(y_test, y_pred)


def main(device, num_samples):
    data = get_data(num_samples, DATA_HOME)
    # trigger potential cuda call overhead
    torch.zeros(1).to(device)

    tic = time.time()
    performance_torch(
        *data,
        batch_size=BATCH_SIZE,
        max_epochs=MAX_EPOCHS,
        lr=LEARNING_RATE,
        device=device,
    )
    print("Time: {:.4f}".format(time.time()-tic))


if __name__ == '__main__':
    parser = argparse.ArgumentParser(description="skorch MNIST benchmark")
    parser.add_argument(
        '--device',
        type=str,
        default='cuda',
        help='device (e.g. "cuda", "cpu")')
    parser.add_argument(
        '--num_samples',
        type=int,
        default=20000,
        help='total number of samples to use')
    args = parser.parse_args()
    main(device=args.device, num_samples=args.num_samples)
	import argparse
	import os

	from sklearn.datasets import fetch_mldata
	from sklearn.model_selection import train_test_split
	from sklearn.metrics import accuracy_score
	from sklearn.utils import shuffle
	from skorch import NeuralNetClassifier
	from skorch.callbacks import EpochScoring
	import torch
	import time
	from torch import nn

	BATCH_SIZE = 128
	DATA_HOME = os.path.join(os.getcwd(), 'examples', 'datasets')
	LEARNING_RATE = 0.1
	MAX_EPOCHS = 12


	def get_data(num_samples, data_home):
	mnist = fetch_mldata('MNIST original', data_home=data_home)
	torch.manual_seed(0)
	X = mnist.data.astype('float32').reshape(-1, 1, 28, 28)
	y = mnist.target.astype('int64')
	X, y = shuffle(X, y)
	X, y = X[:num_samples], y[:num_samples]
	X_train, X_test, y_train, y_test = train_test_split(
	X, y, stratify=y, random_state=0)
	X_train /= 255
	X_test /= 255
	return X_train, X_test, y_train, y_test


	class ClassifierModule(nn.Module):
	def __init__(self):
	super(ClassifierModule, self).__init__()

	self.cnn = nn.Sequential(
	nn.Conv2d(1, 32, (3, 3)),
	nn.ReLU(),
	nn.Conv2d(32, 64, (3, 3)),
	nn.ReLU(),
	nn.MaxPool2d((2, 2)),
	nn.Dropout(0.25),
	)
	self.out = nn.Sequential(
	nn.Linear(64 * 12 * 12, 128),
	nn.ReLU(),
	nn.Dropout(0.5),
	nn.Linear(128, 10),
	nn.Softmax(dim=-1),
	)

	def forward(self, X, **kwargs):
	X = self.cnn(X)
	X = X.reshape(-1, 64 * 12 * 12)
	X = self.out(X)
	return X


	def performance_skorch(
	X_train,
	X_test,
	y_train,
	y_test,
	batch_size,
	device,
	lr,
	max_epochs,
	):
	torch.manual_seed(0)
	net = NeuralNetClassifier(
	ClassifierModule,
	batch_size=batch_size,
	optimizer=torch.optim.Adadelta,
	lr=lr,
	device=device,
	max_epochs=max_epochs,
	callbacks=[
	('tr_acc',
	EpochScoring(
	'accuracy',
	lower_is_better=False,
	on_train=True,
	name='train_acc',
	)),
	],
	)
	net.fit(X_train, y_train)
	y_pred = net.predict(X_test)
	score = accuracy_score(y_test, y_pred)
	return score


	def main(device, num_samples):
	data = get_data(num_samples, DATA_HOME)
	# trigger potential cuda call overhead
	torch.zeros(1).to(device)

	tic = time.time()
	performance_skorch(
	*data,
	batch_size=BATCH_SIZE,
	max_epochs=MAX_EPOCHS,
	lr=LEARNING_RATE,
	device=device,
	)
	print("Time: {:.4f}".format(time.time() -tic))


	if __name__ == '__main__':
	parser = argparse.ArgumentParser(description="skorch MNIST benchmark")
	parser.add_argument(
	'--device',
	type=str,
	default='cuda',
	help='device (e.g. "cuda", "cpu")')
	parser.add_argument(
	'--num_samples',
	type=int,
	default=20000,
	help='total number of samples to use')
	args = parser.parse_args()
	main(device=args.device, num_samples=args.num_samples)