WillKoehrsen/features_dist.py

## features_dist.py
# X_train is our training data, we will make a copy for plotting
X_plot = X_train.copy()
# Compare grades to the median
X_plot['relation_median'] = (X_plot['Grade'] >= 12)
X_plot['Grade'] = X_plot['Grade'].replace({True: 'above',
                                          False: 'below'})
# Plot all variables in a loop
plt.figure(figsize=(12, 12))
for i, col in enumerate(X_plot.columns[:-1]):
    plt.subplot(3, 2, i + 1)
    subset_above = X_plot[X_plot['relation_median'] == 'above']
    subset_below = X_plot[X_plot['relation_median'] == 'below']
    sns.kdeplot(subset_above[col], label = 'Above Median')
    sns.kdeplot(subset_below[col], label = 'Below Median')
    plt.legend()
    plt.title('Distribution of %s' % col)

plt.tight_layout()
	# X_train is our training data, we will make a copy for plotting
	X_plot = X_train.copy()
	# Compare grades to the median
	X_plot['relation_median'] = (X_plot['Grade'] >= 12)
	X_plot['Grade'] = X_plot['Grade'].replace({True: 'above',
	False: 'below'})
	# Plot all variables in a loop
	plt.figure(figsize=(12, 12))
	for i, col in enumerate(X_plot.columns[:-1]):
	plt.subplot(3, 2, i + 1)
	subset_above = X_plot[X_plot['relation_median'] == 'above']
	subset_below = X_plot[X_plot['relation_median'] == 'below']
	sns.kdeplot(subset_above[col], label = 'Above Median')
	sns.kdeplot(subset_below[col], label = 'Below Median')
	plt.legend()
	plt.title('Distribution of %s' % col)

	plt.tight_layout()