applenob/distributed_estimator.py

## distributed_estimator.py
"""
Tensorflow estimator API example

References:
- <https://www.tensorflow.org/guide/custom_estimators>
- <https://github.com/tensorflow/models/blob/master/samples/core/get_started/custom_estimator.py>
- <https://github.com/tensorflow/tensorflow/blob/master/tensorflow/contrib/distribute/README.md>
"""
import numpy as np
import tensorflow as tf

# Build a dummy dataset
d = 16
n_examples = 100
X = np.vstack([
    np.random.normal(10, 2, (n_examples, d)),
    np.random.normal(-10, 2, (n_examples, d))
])
y = np.hstack([
    np.repeat(0, n_examples),
    np.repeat(1, n_examples)
])
print('X', X.shape)
print('y', y.shape)

# Define input fn
def input_fn(features, labels, batch_size, shuffle, repeat):
    if labels is not None:
        inputs = (features, labels)
    else:
        inputs = features
    dataset = tf.data.Dataset.from_tensor_slices(inputs)

    if shuffle:
        dataset = dataset.shuffle(1000)
    if repeat:
        dataset = dataset.repeat()
    dataset = dataset.batch(batch_size)

    # For distributed training, needs to return dataset
    return dataset

    # return dataset.make_one_shot_iterator().get_next()

train_input_fn = lambda: input_fn(X, y, batch_size=128, shuffle=True, repeat=True)
test_input_fn = lambda: input_fn(X, y, batch_size=128, shuffle=False, repeat=False)
predict_input_fn = lambda: input_fn(X, None, batch_size=128, shuffle=False, repeat=False)

def model_fn(features, labels, mode, params):
    """
    features: `x` from input_fn
    labels: `y` from input_fn
    mode: either TRAIN, EVAL, or PREDICT
    params: hyperparams e.g. learning rate
    """

    # Define model
    net = features
    for units in params['hidden_units']:
        net = tf.layers.dense(net, units=units, activation=tf.nn.relu)
    logits = tf.layers.dense(net, params['n_classes'], activation=None)

    probs = tf.nn.softmax(logits)
    preds = tf.argmax(probs, axis=1)

    if mode == tf.estimator.ModeKeys.PREDICT:
        spec = tf.estimator.EstimatorSpec(
            mode=mode,
            predictions={
                'probs': probs,
                'preds': preds
            })

    else:
        loss = tf.losses.sparse_softmax_cross_entropy(labels, logits)
        opt = tf.train.AdamOptimizer(learning_rate=params['learning_rate'])
        train = opt.minimize(loss=loss, global_step=tf.train.get_global_step())

        metrics = {
            'accuracy': tf.metrics.accuracy(labels, preds)
        }

        spec = tf.estimator.EstimatorSpec(
            mode=mode,
            loss=loss,
            train_op=train,
            eval_metric_ops=metrics
        )

    return spec

params = {
    'learning_rate': 1e-4,
    'hidden_units': [16],
    'n_classes': 2
}

distrib = tf.contrib.distribute.MirroredStrategy(num_gpus=2)
run_config = tf.estimator.RunConfig(train_distribute=distrib)

model = tf.estimator.Estimator(
    model_fn=model_fn,
    params=params,
    config=run_config,
    model_dir='./test_model')

tf.logging.set_verbosity(tf.logging.INFO)
model.train(input_fn=train_input_fn, steps=2000)

result = model.evaluate(input_fn=test_input_fn)
print(result)

pred = model.predict(input_fn=predict_input_fn)
for p in pred:
    print(p)
	"""
	Tensorflow estimator API example

	References:
	- <https://www.tensorflow.org/guide/custom_estimators>
	- <https://github.com/tensorflow/models/blob/master/samples/core/get_started/custom_estimator.py>
	- <https://github.com/tensorflow/tensorflow/blob/master/tensorflow/contrib/distribute/README.md>
	"""
	import numpy as np
	import tensorflow as tf

	# Build a dummy dataset
	d = 16
	n_examples = 100
	X = np.vstack([
	np.random.normal(10, 2, (n_examples, d)),
	np.random.normal(-10, 2, (n_examples, d))
	])
	y = np.hstack([
	np.repeat(0, n_examples),
	np.repeat(1, n_examples)
	])
	print('X', X.shape)
	print('y', y.shape)

	# Define input fn
	def input_fn(features, labels, batch_size, shuffle, repeat):
	if labels is not None:
	inputs = (features, labels)
	else:
	inputs = features
	dataset = tf.data.Dataset.from_tensor_slices(inputs)

	if shuffle:
	dataset = dataset.shuffle(1000)
	if repeat:
	dataset = dataset.repeat()
	dataset = dataset.batch(batch_size)

	# For distributed training, needs to return dataset
	return dataset

	# return dataset.make_one_shot_iterator().get_next()

	train_input_fn = lambda: input_fn(X, y, batch_size=128, shuffle=True, repeat=True)
	test_input_fn = lambda: input_fn(X, y, batch_size=128, shuffle=False, repeat=False)
	predict_input_fn = lambda: input_fn(X, None, batch_size=128, shuffle=False, repeat=False)

	def model_fn(features, labels, mode, params):
	"""
	features: `x` from input_fn
	labels: `y` from input_fn
	mode: either TRAIN, EVAL, or PREDICT
	params: hyperparams e.g. learning rate
	"""

	# Define model
	net = features
	for units in params['hidden_units']:
	net = tf.layers.dense(net, units=units, activation=tf.nn.relu)
	logits = tf.layers.dense(net, params['n_classes'], activation=None)

	probs = tf.nn.softmax(logits)
	preds = tf.argmax(probs, axis=1)

	if mode == tf.estimator.ModeKeys.PREDICT:
	spec = tf.estimator.EstimatorSpec(
	mode=mode,
	predictions={
	'probs': probs,
	'preds': preds
	})

	else:
	loss = tf.losses.sparse_softmax_cross_entropy(labels, logits)
	opt = tf.train.AdamOptimizer(learning_rate=params['learning_rate'])
	train = opt.minimize(loss=loss, global_step=tf.train.get_global_step())

	metrics = {
	'accuracy': tf.metrics.accuracy(labels, preds)
	}

	spec = tf.estimator.EstimatorSpec(
	mode=mode,
	loss=loss,
	train_op=train,
	eval_metric_ops=metrics
	)

	return spec

	params = {
	'learning_rate': 1e-4,
	'hidden_units': [16],
	'n_classes': 2
	}

	distrib = tf.contrib.distribute.MirroredStrategy(num_gpus=2)
	run_config = tf.estimator.RunConfig(train_distribute=distrib)

	model = tf.estimator.Estimator(
	model_fn=model_fn,
	params=params,
	config=run_config,
	model_dir='./test_model')

	tf.logging.set_verbosity(tf.logging.INFO)
	model.train(input_fn=train_input_fn, steps=2000)

	result = model.evaluate(input_fn=test_input_fn)
	print(result)

	pred = model.predict(input_fn=predict_input_fn)
	for p in pred:
	print(p)