KSV Muralidhar ksv-muralidhar

## stratified_cv1.py
import pandas as pd
import numpy as np
from sklearn.datasets import make_classification
from sklearn.model_selection import train_test_split, StratifiedKFold, StratifiedShuffleSplit, KFold

make_class = make_classification(n_samples=500,n_features=3,n_redundant=0,n_informative=2,n_classes=3,n_clusters_per_class=1,random_state=11)
data = pd.DataFrame(make_class[0],columns=range(make_class[0].shape[1]))
data['target'] = make_class[1]
data.head()

## outlier_detect_1.py
from sklearn.datasets import load_wine
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
data = pd.DataFrame(load_wine()["data"],columns=load_wine()["feature_names"])
data.head()

## eda_1.py
from sklearn.datasets import load_diabetes
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
# LOADING DIABETES DATA (INPUT FEATURES) AND STORING IT IN A DATA FRAME
data = pd.DataFrame(load_diabetes()["data"],columns=load_diabetes()["feature_names"])
#ADDING TARGET VARIABLE TO THE DATA FRAME
data["target"] = load_diabetes()["target"]

## py_plot_1.py
import pandas as pd
from sklearn.datasets import load_iris
import matplotlib.pyplot as plt
import seaborn as sns
data = pd.DataFrame(load_iris()["data"],columns=load_iris()['feature_names'])
data["species"] = load_iris()["target"]
data.head()

## gauss_transform_1.py
from sklearn.preprocessing import FunctionTransformer, ColumnTransformer
log_transform = FunctionTransformer(lambda x: np.log(x))
ct = ColumnTransformer(transformers=[['log_transform',log_transform,list(range(len(X.columns)))]],remainder='passthrough')
log_X = ct.fit_transform(X).copy()
log_X = pd.DataFrame(log_X,columns=[0,1,2,3]).copy()

## gauss_test_1.py
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.datasets import load_iris
#Converting the data from an array to a data frame
X = pd.DataFrame(load_iris()["data"]).copy()

## learning_curve_1.py
from sklearn.model_selection import learning_curve

## api_1.py
import requests
import pandas as pd
from IPython.display import display

## hist_1.py
fig,ax = plt.subplots(2,3,figsize=(15,10))
row = col = 0
np.random.seed(11)
norm_dist = np.random.randn(1000)
for n,i in enumerate(np.linspace(5,100,6)):
    if (n>0) & (n%3==0):
        row += 1
        col = 0
    sns.histplot(x=norm_dist,bins=int(i),ax=ax[row,col])
    ax[row,col].set_title(f'bins = {int(i)}')

## pipe_1.py
from sklearn.compose import ColumnTransformer
	import pandas as pd
	import numpy as np
	from sklearn.datasets import make_classification
	from sklearn.model_selection import train_test_split, StratifiedKFold, StratifiedShuffleSplit, KFold

	make_class = make_classification(n_samples=500,n_features=3,n_redundant=0,n_informative=2,n_classes=3,n_clusters_per_class=1,random_state=11)
	data = pd.DataFrame(make_class[0],columns=range(make_class[0].shape[1]))
	data['target'] = make_class[1]
	data.head()
	from sklearn.datasets import load_wine
	import pandas as pd
	import numpy as np
	import matplotlib.pyplot as plt
	import seaborn as sns
	data = pd.DataFrame(load_wine()["data"],columns=load_wine()["feature_names"])
	data.head()
	from sklearn.datasets import load_diabetes
	import numpy as np
	import pandas as pd
	import matplotlib.pyplot as plt
	import seaborn as sns
	# LOADING DIABETES DATA (INPUT FEATURES) AND STORING IT IN A DATA FRAME
	data = pd.DataFrame(load_diabetes()["data"],columns=load_diabetes()["feature_names"])
	#ADDING TARGET VARIABLE TO THE DATA FRAME
	data["target"] = load_diabetes()["target"]
	import pandas as pd
	from sklearn.datasets import load_iris
	import matplotlib.pyplot as plt
	import seaborn as sns
	data = pd.DataFrame(load_iris()["data"],columns=load_iris()['feature_names'])
	data["species"] = load_iris()["target"]
	data.head()
	from sklearn.preprocessing import FunctionTransformer, ColumnTransformer
	log_transform = FunctionTransformer(lambda x: np.log(x))
	ct = ColumnTransformer(transformers=[['log_transform',log_transform,list(range(len(X.columns)))]],remainder='passthrough')
	log_X = ct.fit_transform(X).copy()
	log_X = pd.DataFrame(log_X,columns=[0,1,2,3]).copy()
	import requests
	import pandas as pd
	from IPython.display import display
	fig,ax = plt.subplots(2,3,figsize=(15,10))
	row = col = 0
	np.random.seed(11)
	norm_dist = np.random.randn(1000)
	for n,i in enumerate(np.linspace(5,100,6)):
	if (n>0) & (n%3==0):
	row += 1
	col = 0
	sns.histplot(x=norm_dist,bins=int(i),ax=ax[row,col])
	ax[row,col].set_title(f'bins = {int(i)}')