Nemitek/keras_prediction.py

## keras_prediction.py
import pandas as pd
from random import random

flow = (list(range(1,10,1)) + list(range(10,1,-1)))*1000
pdata = pd.DataFrame({"a":flow, "b":flow})
pdata.b = pdata.b.shift(9)
data = pdata.iloc[10:] * random()  # some noise

import numpy as np

def _load_data(data, n_prev = 100):
    """
    data should be pd.DataFrame()
    """

    docX, docY = [], []
    for i in range(len(data)-n_prev):
        docX.append(data.iloc[i:i+n_prev].as_matrix())
        docY.append(data.iloc[i+n_prev].as_matrix())
    alsX = np.array(docX)
    alsY = np.array(docY)

    return alsX, alsY

def train_test_split(df, test_size=0.1):
    """
    This just splits data to training and testing parts
    """
    ntrn = round(len(df) * (1 - test_size))

    X_train, y_train = _load_data(df.iloc[0:ntrn])
    X_test, y_test = _load_data(df.iloc[ntrn:])

    return (X_train, y_train), (X_test, y_test)

from keras.models import Sequential
from keras.layers.core import Dense, Activation
from keras.layers.recurrent import LSTM

in_neurons = 2
out_neurons = 2
hidden_neurons = 20

model = Sequential()
model.add(LSTM(output_dim=hidden_neurons, input_dim=in_neurons, return_sequences=False))
model.add(Dense(output_dim=out_neurons, input_dim=hidden_neurons))
model.add(Activation("linear"))
model.compile(loss="mean_squared_error", optimizer="rmsprop")

(X_train, y_train), (X_test, y_test) = train_test_split(data)  # retrieve data
model.fit(X_train, y_train, batch_size=450, nb_epoch=10, validation_split=0.05)

predicted = model.predict(X_test)
rmse = np.sqrt(((predicted - y_test) ** 2).mean(axis=0))

# and maybe plot it
pd.DataFrame(predicted[:100]).to_csv("predicted.csv")
pd.DataFrame(y_test[:100]).plot("test_data.csv")
	import pandas as pd
	from random import random

	flow = (list(range(1,10,1)) + list(range(10,1,-1)))*1000
	pdata = pd.DataFrame({"a":flow, "b":flow})
	pdata.b = pdata.b.shift(9)
	data = pdata.iloc[10:] * random() # some noise

	import numpy as np

	def _load_data(data, n_prev = 100):
	"""
	data should be pd.DataFrame()
	"""

	docX, docY = [], []
	for i in range(len(data)-n_prev):
	docX.append(data.iloc[i:i+n_prev].as_matrix())
	docY.append(data.iloc[i+n_prev].as_matrix())
	alsX = np.array(docX)
	alsY = np.array(docY)

	return alsX, alsY

	def train_test_split(df, test_size=0.1):
	"""
	This just splits data to training and testing parts
	"""
	ntrn = round(len(df) * (1 - test_size))

	X_train, y_train = _load_data(df.iloc[0:ntrn])
	X_test, y_test = _load_data(df.iloc[ntrn:])

	return (X_train, y_train), (X_test, y_test)

	from keras.models import Sequential
	from keras.layers.core import Dense, Activation
	from keras.layers.recurrent import LSTM

	in_neurons = 2
	out_neurons = 2
	hidden_neurons = 20

	model = Sequential()
	model.add(LSTM(output_dim=hidden_neurons, input_dim=in_neurons, return_sequences=False))
	model.add(Dense(output_dim=out_neurons, input_dim=hidden_neurons))
	model.add(Activation("linear"))
	model.compile(loss="mean_squared_error", optimizer="rmsprop")

	(X_train, y_train), (X_test, y_test) = train_test_split(data) # retrieve data
	model.fit(X_train, y_train, batch_size=450, nb_epoch=10, validation_split=0.05)

	predicted = model.predict(X_test)
	rmse = np.sqrt(((predicted - y_test) ** 2).mean(axis=0))

	# and maybe plot it
	pd.DataFrame(predicted[:100]).to_csv("predicted.csv")
	pd.DataFrame(y_test[:100]).plot("test_data.csv")