AurelianTactics/gist:f279576cc943405099b0f4582e57cda1

## gistfile1.txt
states_batch, action_batch, reward_batch, next_states_batch, done_batch = map(np.array, zip(*minibatch))

q_values_next = target_model.predict(next_states_batch,batch_size=BATCH)
targets = np.zeros((BATCH,ACTIONS)) #BATCHxACTIONS
targets[ti_tuple,action_batch] = reward_batch + done_batch * GAMMA * np.amax(q_values_next,axis=1)
loss += model.train_on_batch(states_batch, targets)
	states_batch, action_batch, reward_batch, next_states_batch, done_batch = map(np.array, zip(*minibatch))

	q_values_next = target_model.predict(next_states_batch,batch_size=BATCH)
	targets = np.zeros((BATCH,ACTIONS)) #BATCHxACTIONS
	targets[ti_tuple,action_batch] = reward_batch + done_batch * GAMMA * np.amax(q_values_next,axis=1)
	loss += model.train_on_batch(states_batch, targets)