Dmitry Kakurin Dimagog

## pg-pong.py
""" Trains an agent with (stochastic) Policy Gradients on Pong. Uses OpenAI Gym. """
import numpy as np
import pickle
# import gym

# hyperparameters
H = 3 # number of hidden layer neurons
batch_size = 20 # every how many episodes to do a param update?
learning_rate = 1e-4
gamma = 0.99 # discount factor for reward

## readme.md

      
        
          
            
              
              1 file
            
          
          
            
              
              0 forks
            
          
            
              
                
                0 comments
              
            
          
            
              
              0 stars
            
          
        
        
          
              
          
          
            
                Dimagog
                / readme.md
            
            
              Last active
              December 19, 2015 17:18
            
              
                Async GET.
Code for blog post
http://dimagog.github.io/blog/clojure/clojurescript/2013/07/12/making-http-requests-from-clojurescript-with-core.async/
              
          
        
      
        
  
      
    Sample code for Dimagog Blog post Making HTTP requests from ClojureScript with core.async.
Gists don't support dirs, so I had to move it to Github.
	""" Trains an agent with (stochastic) Policy Gradients on Pong. Uses OpenAI Gym. """
	import numpy as np
	import pickle
	# import gym

	# hyperparameters
	H = 3 # number of hidden layer neurons
	batch_size = 20 # every how many episodes to do a param update?
	learning_rate = 1e-4
	gamma = 0.99 # discount factor for reward