Moustafa Alzantot malzantot

## mountaincar_qlearning.py
"""
Q-Learning example using OpenAI gym MountainCar enviornment

Author: Moustafa Alzantot (malzantot@ucla.edu)

"""
import numpy as np

import gym
from gym import wrappers

## frozenlake8x8_policyiteration.py
"""
Solving FrozenLake8x8 environment using Policy iteration.
Author : Moustafa Alzantot (malzantot@ucla.edu)
"""
import numpy as np
import gym
from gym import wrappers


def run_episode(env, policy, gamma = 1.0, render = False):

## frozenlake8x8_valueiteration.py
"""
Solving FrozenLake8x8 environment using Value-Itertion.


Author : Moustafa Alzantot (malzantot@ucla.edu)
"""
import numpy as np
import gym
from gym import wrappers

## mountaincar_qlearning.py
"""
Q-Learning example using OpenAI gym MountainCar enviornment
Author: Moustafa Alzantot (malzantot@ucla.edu)
"""
import numpy as np

import gym
from gym import wrappers

n_states = 50

## frozenlake_genetic_algorithm.py
import numpy as np
import random
import time
import gym
from gym import wrappers

def run_episode(env, policy, episode_len=100):
    total_reward = 0
    obs = env.reset()
    for t in range(episode_len):

## frozenlake_randomsearch.py
import numpy as np
import time

import gym

def run_episode(env, policy, episode_len=100, render=False):
    total_reward = 0
    obs = env.reset()
    for t in range(episode_len):
        if render:

## cartpole_policysearch.py
import gym
import numpy as np

def gen_random_policy():
	return (np.random.uniform(-1,1, size=4), np.random.uniform(-1,1))

def policy_to_action(env, policy, obs):
    if np.dot(policy[0], obs) + policy[1] > 0:
    	return 1
    else:

## openai_gym101.py
import gym

env = gym.make('CartPole-v0')

# Restart the environment to start a new episode
obs = env.reset()

for step_idx in range(500):
  env.render()
  obs, reward, done, _ = env.step(env.action_space.sample())
	"""
	Q-Learning example using OpenAI gym MountainCar enviornment

	Author: Moustafa Alzantot (malzantot@ucla.edu)

	"""
	import numpy as np

	import gym
	from gym import wrappers
	"""
	Solving FrozenLake8x8 environment using Policy iteration.
	Author : Moustafa Alzantot (malzantot@ucla.edu)
	"""
	import numpy as np
	import gym
	from gym import wrappers


	def run_episode(env, policy, gamma = 1.0, render = False):
	import numpy as np
	import random
	import time
	import gym
	from gym import wrappers

	def run_episode(env, policy, episode_len=100):
	total_reward = 0
	obs = env.reset()
	for t in range(episode_len):
	import gym
	import numpy as np

	def gen_random_policy():
	return (np.random.uniform(-1,1, size=4), np.random.uniform(-1,1))

	def policy_to_action(env, policy, obs):
	if np.dot(policy[0], obs) + policy[1] > 0:
	return 1
	else:
	import gym

	env = gym.make('CartPole-v0')

	# Restart the environment to start a new episode
	obs = env.reset()

	for step_idx in range(500):
	env.render()
	obs, reward, done, _ = env.step(env.action_space.sample())