steleu

## pg-mountaincar.py
# -*- coding: utf-8 -*-

""" Trains an agent with (stochastic) Policy Gradients on MountainCar-v0. Uses OpenAI Gym. """
import numpy as np
import cPickle as pickle
import gym

# hyperparameters
H = 200 # number of hidden layer neurons
batch_size = 5 # every how many episodes to do a param update?
	# -- coding: utf-8 --

	""" Trains an agent with (stochastic) Policy Gradients on MountainCar-v0. Uses OpenAI Gym. """
	import numpy as np
	import cPickle as pickle
	import gym

	# hyperparameters
	H = 200 # number of hidden layer neurons
	batch_size = 5 # every how many episodes to do a param update?