Skip to content

Instantly share code, notes, and snippets.

@fk-pixel
Created August 24, 2020 17:21
Show Gist options
  • Save fk-pixel/1abb28ae04f77457b40cf2c6c5b61443 to your computer and use it in GitHub Desktop.
Save fk-pixel/1abb28ae04f77457b40cf2c6c5b61443 to your computer and use it in GitHub Desktop.
#ülkeler mutluluk siralamasi kriterleri ve max enfekte olan sayi arasindaki korelasyon icin iki veri setimizde artik hazir
#öncelikle join ile iki verinin tek cerceve icine alinmasi:
data = corona_data.join(happiness_report_csv,how="inner")
data.head()
#daha sonra korelasyon fonksiyonunu kullanacagiz:
data.corr()
#ve datanin görsellestirilme islemi baslar:
data.head()
#iki verinin seaborn ile korelasyon incelemesi:
#x ve y icin karsilastirmak isteyecegimiz sütunlardan GDP / max.inf.rate ile baslayalim:
x = data["GDP per capita"]
y = data["max_infection_rate"]
sns.scatterplot(x,y)
#ancak logaritmik ölceklendirmeyle daha iyi görsellik kazanmasini saglamak gerekebilir, o halde:
x = data["GDP per capita"]
y = data["max_infection_rate"]
sns.scatterplot(x, np.log(y))
#yukarda y eksenindeki veriler cok arasinda fark olan baremlerden olusurken x ekseninde virgülle atlaniyordu.
#Bu cizgi cekmemizi kolaylastiracak. Öyleyse regresyon cizgimiz icin:
sns.regplot(x, np.log(y))
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment