araffin/a2c_lunar.py

## a2c_lunar.py
import gym

from stable_baselines import A2C
from stable_baselines.common.policies import MlpPolicy
from stable_baselines.common.vec_env import DummyVecEnv

# Create and wrap the environment
env = gym.make('LunarLander-v2')
env = DummyVecEnv([lambda: env])

model = A2C(MlpPolicy, env, ent_coef=0.1, verbose=1)
# Train the agent
model.learn(total_timesteps=100000)
# Save the agent
model.save("a2c_lunar")
del model  # delete trained model to demonstrate loading

# Load the trained agent
model = A2C.load("a2c_lunar")

# Enjoy trained agent
obs = env.reset()
for i in range(1000):
    action, _states = model.predict(obs)
    obs, rewards, dones, info = env.step(action)
    env.render()
	import gym

	from stable_baselines import A2C
	from stable_baselines.common.policies import MlpPolicy
	from stable_baselines.common.vec_env import DummyVecEnv

	# Create and wrap the environment
	env = gym.make('LunarLander-v2')
	env = DummyVecEnv([lambda: env])

	model = A2C(MlpPolicy, env, ent_coef=0.1, verbose=1)
	# Train the agent
	model.learn(total_timesteps=100000)
	# Save the agent
	model.save("a2c_lunar")
	del model # delete trained model to demonstrate loading

	# Load the trained agent
	model = A2C.load("a2c_lunar")

	# Enjoy trained agent
	obs = env.reset()
	for i in range(1000):
	action, _states = model.predict(obs)
	obs, rewards, dones, info = env.step(action)
	env.render()