Skip to content

Instantly share code, notes, and snippets.

@pocokhc
pocokhc / qiita_10_r2d2.py
Created June 23, 2019 02:06
DQNでハイパーパラメータを比較したときのコードです。
import gym
import pickle
import os
import numpy as np
import random
import time
import traceback
import math
@pocokhc
pocokhc / qiita_10_rainbowr.py
Created June 23, 2019 02:05
DQNでハイパーパラメータを比較したときのコードです。
import gym
import pickle
import os
import numpy as np
import random
import math
import time
import tensorflow as tf
@pocokhc
pocokhc / qiita_09_policy_dqn.py
Created June 10, 2019 12:13
DQNでいろいろな方策ポリシーを実装したコードです。
import gym
import pickle
import os
import numpy as np
import random
import math
import time
import tensorflow as tf
@pocokhc
pocokhc / qiita_09_policy_ql.py
Created June 10, 2019 12:09
Q学習でいろいろな方策ポリシーを実装したコードです。
import gym
import pickle
import os
import rl.core
import numpy as np
import matplotlib.pyplot as plt
import random
import math
import time
@pocokhc
pocokhc / qiita08_R2D2.py
Last active June 9, 2019 06:30
kera-rlでR2D2用のAgentを実装したコードです。
import gym
import pickle
import os
import numpy as np
import random
import time
import traceback
import math
@pocokhc
pocokhc / qiita08_RainbowR.py
Last active June 6, 2019 13:11
kera-rlでDRQN+Rainbow用のAgentを実装したコードです。
import gym
import pickle
import os
import numpy as np
import random
import math
import tensorflow as tf
@pocokhc
pocokhc / qiita07_LSTM.py
Created May 27, 2019 10:45
KerasのステートレスLSTMとステートフルLSTMを検証した時のコードです。
from keras.models import Sequential
from keras.layers import *
from keras.optimizers import Adam
from keras.preprocessing.sequence import TimeseriesGenerator
from keras.utils import np_utils
from keras import backend as K
import matplotlib.pyplot as plt
import numpy as np
import random
@pocokhc
pocokhc / qiita06_dueling_network.py
Last active May 23, 2019 13:44
DQNのDuelingNetworkでSaliencyMapとGrad_CAMを試したコードです。
import gym
import pickle
import os
import numpy as np
import random
import tensorflow as tf
from keras.optimizers import Adam
@pocokhc
pocokhc / qiita06_vis.py
Created May 22, 2019 12:50
MNISTでSaliencyMapとGrad_CAMを試したコードです。
'''Trains a simple convnet on the MNIST dataset.
Gets to 99.25% test accuracy after 12 epochs
(there is still a lot of margin for parameter tuning).
16 seconds per epoch on a GRID K520 GPU.
'''
from __future__ import print_function
import keras
from keras.datasets import mnist
from keras.models import Sequential
@pocokhc
pocokhc / qiita_05_apex.py
Created May 18, 2019 03:28
kera-rlでApe-X用のAgentを実装したコードです。
import gym
import pickle
import os
import numpy as np
import random
import time
import traceback
import tensorflow as tf