Pratik Gandhi pkgandhi

## AR_MA.py
# Loading the packages
import pandas as pd
from statsmodels.tsa.statespace.sarimax import SARIMAX

# Loading the data
data = pd.read_csv('https://raw.githubusercontent.com/jbrownlee/Datasets/master/airline-passengers.csv')

# Setting the month as index
data = data.set_index('Month')

## ADFTest.py
# Loading the packages
import pandas as pd
import numpy as np
import statsmodels.tsa.stattools as sm
import matplotlib.pyplot as plt
plt.style.use('fivethirtyeight')

# Loading the dataset:
data = pd.read_csv('../AirPassengers.csv')
data = data.rename(columns = {'#Passengers':'Passengers'})

## PPTest.py
# Loading the packages
import pandas as pd
import pmdarima

# Loading the dataset:
data = pd.read_csv('../AirPassengers.csv')
data = data.rename(columns = {'#Passengers':'Passengers'})
data = data.set_index('Month')

# Conducting PP test:

## KPSSTest.py
# Loading the packages
import pandas as pd
import numpy as np
import statsmodels.tsa.stattools as sm
import matplotlib.pyplot as plt
plt.style.use('fivethirtyeight')

# Loading the dataset:
data = pd.read_csv('../AirPassengers.csv')
data = data.rename(columns = {'#Passengers':'Passengers'})

## OCSBTest.py
# Loading the packages
import pandas as pd
import pmdarima

# Loading the dataset:
data = pd.read_csv('../AirPassengers.csv')
data = data.rename(columns = {'#Passengers':'Passengers'})
data = data.set_index('Month')

# Conducting OCSB test:

## decompose_plot.py
# Loading the packages
import pandas as pd
from statsmodels.tsa.seasonal import seasonal_decompose
import matplotlib.pyplot as plt


# Loading the dataset:
data = pd.read_csv('../AirPassengers.csv')
data = data.rename(columns = {'#Passengers':'Passengers'})
data = data.set_index('Month')

## ACF_PACF.py
# Loading the packages
import pandas as pd
from statsmodels.graphics import tsaplots
plt.style.use('fivethirtyeight')

# Loading the dataset:
data = pd.read_csv('../AirPassengers.csv')
data = data.rename(columns = {'#Passengers':'Passengers'})
data = data.set_index('Month')

## CHTest.py
# Loading the packages
import pandas as pd
import pmdarima

# Loading the dataset:
data = pd.read_csv('../AirPassengers.csv')
data = data.rename(columns = {'#Passengers':'Passengers'})
data = data.set_index('Month')

# Conducting CH test:

## basic_optuna.py
# Importing the Packages:
import optuna
import pandas as pd
from sklearn import linear_model
from sklearn import ensemble
from sklearn import datasets
from sklearn import model_selection

#Grabbing a sklearn Classification dataset:
X,y = datasets.load_breast_cancer(return_X_y=True, as_frame=True)

## study_results.py
# Getting the best trial:
print(f"The best trial is : \n{study.best_trial}")
# >> Output:
#The best trial is :
#FrozenTrial(number=18, value=0.9631114824097281, datetime_start=datetime.datetime(2020, 8, 16, 14, 24, 37, 407344), datetime_complete=datetime.datetime(2020, 8, 16, 14, 24, 37, 675114), params={'classifier': 'RandomForest', 'rf_n_estimators': 153, 'rf_max_depth': 21},
#distributions={'classifier': CategoricalDistribution(choices=('LogReg', 'RandomForest')), 'rf_n_estimators': IntUniformDistribution(high=1000, low=10, step=1), 'rf_max_depth': IntLogUniformDistribution(high=32, low=2, step=1)}, user_attrs={}, system_attrs={}, intermediate_values={}, trial_id=18, state=TrialState.COMPLETE)

# Getting the best score:
print(f"The best value is : \n{study.best_value}")
# >> Output:
	# Loading the packages
	import pandas as pd
	from statsmodels.tsa.statespace.sarimax import SARIMAX

	# Loading the data
	data = pd.read_csv('https://raw.githubusercontent.com/jbrownlee/Datasets/master/airline-passengers.csv')

	# Setting the month as index
	data = data.set_index('Month')
	# Loading the packages
	import pandas as pd
	import numpy as np
	import statsmodels.tsa.stattools as sm
	import matplotlib.pyplot as plt
	plt.style.use('fivethirtyeight')

	# Loading the dataset:
	data = pd.read_csv('../AirPassengers.csv')
	data = data.rename(columns = {'#Passengers':'Passengers'})
	# Loading the packages
	import pandas as pd
	import pmdarima

	# Loading the dataset:
	data = pd.read_csv('../AirPassengers.csv')
	data = data.rename(columns = {'#Passengers':'Passengers'})
	data = data.set_index('Month')

	# Conducting PP test:
	# Loading the packages
	import pandas as pd
	from statsmodels.tsa.seasonal import seasonal_decompose
	import matplotlib.pyplot as plt


	# Loading the dataset:
	data = pd.read_csv('../AirPassengers.csv')
	data = data.rename(columns = {'#Passengers':'Passengers'})
	data = data.set_index('Month')
	# Loading the packages
	import pandas as pd
	from statsmodels.graphics import tsaplots
	plt.style.use('fivethirtyeight')

	# Loading the dataset:
	data = pd.read_csv('../AirPassengers.csv')
	data = data.rename(columns = {'#Passengers':'Passengers'})
	data = data.set_index('Month')
	# Importing the Packages:
	import optuna
	import pandas as pd
	from sklearn import linear_model
	from sklearn import ensemble
	from sklearn import datasets
	from sklearn import model_selection

	#Grabbing a sklearn Classification dataset:
	X,y = datasets.load_breast_cancer(return_X_y=True, as_frame=True)
	# Getting the best trial:
	print(f"The best trial is : \n{study.best_trial}")
	# >> Output:
	#The best trial is :
	#FrozenTrial(number=18, value=0.9631114824097281, datetime_start=datetime.datetime(2020, 8, 16, 14, 24, 37, 407344), datetime_complete=datetime.datetime(2020, 8, 16, 14, 24, 37, 675114), params={'classifier': 'RandomForest', 'rf_n_estimators': 153, 'rf_max_depth': 21},
	#distributions={'classifier': CategoricalDistribution(choices=('LogReg', 'RandomForest')), 'rf_n_estimators': IntUniformDistribution(high=1000, low=10, step=1), 'rf_max_depth': IntLogUniformDistribution(high=32, low=2, step=1)}, user_attrs={}, system_attrs={}, intermediate_values={}, trial_id=18, state=TrialState.COMPLETE)

	# Getting the best score:
	print(f"The best value is : \n{study.best_value}")
	# >> Output: