fk-pixel/Pandas korelasyon.py

## Pandas korelasyon.py
#ülkeler mutluluk siralamasi kriterleri ve max enfekte olan sayi arasindaki korelasyon icin iki veri setimizde artik hazir
#öncelikle join ile iki verinin tek cerceve icine alinmasi:
data = corona_data.join(happiness_report_csv,how="inner")
data.head()
#daha sonra korelasyon fonksiyonunu kullanacagiz:
data.corr()
#ve datanin görsellestirilme islemi baslar:
data.head()

#iki verinin seaborn ile korelasyon incelemesi:
#x ve y icin karsilastirmak isteyecegimiz sütunlardan GDP / max.inf.rate ile baslayalim:
x = data["GDP per capita"]
y = data["max_infection_rate"]
sns.scatterplot(x,y)

#ancak logaritmik ölceklendirmeyle daha iyi görsellik kazanmasini saglamak gerekebilir, o halde:
x = data["GDP per capita"]
y = data["max_infection_rate"]
sns.scatterplot(x, np.log(y))
#yukarda y eksenindeki veriler cok arasinda fark olan baremlerden olusurken x ekseninde virgülle atlaniyordu.
#Bu cizgi cekmemizi kolaylastiracak. Öyleyse regresyon cizgimiz icin:
sns.regplot(x, np.log(y))
	#ülkeler mutluluk siralamasi kriterleri ve max enfekte olan sayi arasindaki korelasyon icin iki veri setimizde artik hazir
	#öncelikle join ile iki verinin tek cerceve icine alinmasi:
	data = corona_data.join(happiness_report_csv,how="inner")
	data.head()
	#daha sonra korelasyon fonksiyonunu kullanacagiz:
	data.corr()
	#ve datanin görsellestirilme islemi baslar:
	data.head()

	#iki verinin seaborn ile korelasyon incelemesi:
	#x ve y icin karsilastirmak isteyecegimiz sütunlardan GDP / max.inf.rate ile baslayalim:
	x = data["GDP per capita"]
	y = data["max_infection_rate"]
	sns.scatterplot(x,y)

	#ancak logaritmik ölceklendirmeyle daha iyi görsellik kazanmasini saglamak gerekebilir, o halde:
	x = data["GDP per capita"]
	y = data["max_infection_rate"]
	sns.scatterplot(x, np.log(y))
	#yukarda y eksenindeki veriler cok arasinda fark olan baremlerden olusurken x ekseninde virgülle atlaniyordu.
	#Bu cizgi cekmemizi kolaylastiracak. Öyleyse regresyon cizgimiz icin:
	sns.regplot(x, np.log(y))