araffin/continual_rl.py

## continual_rl.py
from stable_baselines.common.cmd_util import make_atari_env
from stable_baselines.common.policies import CnnPolicy
from stable_baselines import PPO2

# There already exists an environment generator
# that will make and wrap atari environments correctly
env = make_atari_env('DemonAttackNoFrameskip-v4', num_env=8, seed=0)

model = PPO2(CnnPolicy, env, verbose=1)
model.learn(total_timesteps=10000)

obs = env.reset()
for i in range(1000):
    action, _states = model.predict(obs)
    obs, rewards, dones, info = env.step(action)
    env.render()

# The number of environments must be identical when changing environments
env = make_atari_env('SpaceInvadersNoFrameskip-v4', num_env=8, seed=0)

# change env
model.set_env(env)
model.learn(total_timesteps=10000)

obs = env.reset()
while True:
    action, _states = model.predict(obs)
    obs, rewards, dones, info = env.step(action)
    env.render()
	from stable_baselines.common.cmd_util import make_atari_env
	from stable_baselines.common.policies import CnnPolicy
	from stable_baselines import PPO2

	# There already exists an environment generator
	# that will make and wrap atari environments correctly
	env = make_atari_env('DemonAttackNoFrameskip-v4', num_env=8, seed=0)

	model = PPO2(CnnPolicy, env, verbose=1)
	model.learn(total_timesteps=10000)

	obs = env.reset()
	for i in range(1000):
	action, _states = model.predict(obs)
	obs, rewards, dones, info = env.step(action)
	env.render()

	# The number of environments must be identical when changing environments
	env = make_atari_env('SpaceInvadersNoFrameskip-v4', num_env=8, seed=0)

	# change env
	model.set_env(env)
	model.learn(total_timesteps=10000)

	obs = env.reset()
	while True:
	action, _states = model.predict(obs)
	obs, rewards, dones, info = env.step(action)
	env.render()