Skip to content

Instantly share code, notes, and snippets.

@Kenan7
Created June 24, 2020 18:16
Show Gist options
  • Star 0 You must be signed in to star a gist
  • Fork 0 You must be signed in to fork a gist
  • Save Kenan7/451257e9f8f44fe304bc00f1d16f61bd to your computer and use it in GitHub Desktop.
Save Kenan7/451257e9f8f44fe304bc00f1d16f61bd to your computer and use it in GitHub Desktop.

Yapay Zeka

Mirkenan Kazımzade - 17155960

Ödev 9

Soru 9-1

MiniMax Algoritması

Yazılımında MiniMax algoritması olan bir robot düşün. Bu robot MiniMax algoritmasını kullanarak, bir oyunda(satranç, tictactoe, go) sonraki hamleleri düşünüp, hesaplayıp en iyi kararı verebilir. Tabi rakibin de en iyi kararları vereceğini düşünerek.

Bunu, kendini Max, rakibini ise Min oyuncusu olduğunu varsayarak yapıyor. Min oyuncusu rakip olduğundan hep senin hamlelerini minimale düşürür.

3 ile 5 arasından 3 ü seçer.

Game Theory  MiniMax Algorithm

Max oyuncusunun sen olduğunu varsayarak hamleleri maksimale arttırır. 3 ile 2 arasından 3 ü seçer.

Game Theory MiniMax Algorithm1


Soru 9-2

Alfa-Beta

Önceki kısımda bu robot en iyi hamleyi seçer demiştim. Ama ne kadar ilerideki hamleyi düşünüp kararverebilir? Sonuçta bu robotun bir işlemcisi, hafızası olduğundan bir limiti var. Körü körüne tüm hameleleri düşünemez. Bir optimize yolu olması gerekiyor, değil mi? Bunu Alfa-Beta budaması metoduyla yapıyor.

Diyelim ki, şöyle bir "hamle ağac"ımız var, bu kısımda optimize algoritmamız 7nin sağındaki değeri okumayacak çünkü okuyacağı en küçük değerin 7 olduğunu varsayarak, 5 ile 7 arasından da minimum sayıyı hesapladığımızda da zaten 5 seçileceğinden diğer hamleleri keşfetmeye gerek yok

alpha beta


Ödev 10

Soru 10-1

Makine öğrenmesi metotları

Denetimli Öğrenme (Supervised Learning)
Denetimli öğrenmede, makine örnek olarak öğretilir. Operatör, makine öğrenme algoritmasını, istenen giriş ve çıkışları içeren bilinen bir veri kümesi ile sağlar ve algoritma, bu giriş ve çıkışlara nasıl ulaşılacağını belirleyen bir yöntem bulmaktadır.

Operatör, sorunun doğru cevaplarını bilmesine rağmen, algoritma verideki kalıpları tanımlar, gözlemleri öğrenir ve tahminlerde bulunur. Algoritma tahminlerde bulunur ve operatör tarafından düzeltilir. Bu işlem algoritma yüksek düzeyde bir doğruluk / performans elde edene kadar devam eder.
Sınıflandırma (Classification)
Sınıflandırma görevlerinde, makine öğrenme programı gözlemlenen değerlerden bir sonuç çıkarmalı ve yeni gözlemlerin hangi kategoriye ait olduğunu belirlemelidir. Örneğin, e-postaları “spam” veya “spam değil” olarak filtrelerken, programın mevcut gözlemsel verilere bakması ve e-postaları buna göre filtrelemesi gerekmektedir.
Regresyon (Regression)
Regresyon görevlerinde, makine öğrenme programı değişkenler arasındaki ilişkileri tahmin etmeli ve anlamalıdır. Regresyon analizi, bir bağımlı değişkene ve bir dizi başka değişkene odaklanır. Bu, özellikle tahmin için faydalıdır.
Denetimsiz Öğrenme (Unsupervised Learning)
Kümeleme (Clustering)
Kümeleme, benzer verilerin (tanımlanmış kriterlere göre) gruplandırılmasını içerir. Verileri birkaç gruba ayırmak ve kalıpları bulmak için her veri kümesinde analiz yapmak faydalıdır.
Birliktelik (Association)
Elimizdeki verilerin aralarındaki birliktelik ilişkisi çözmeye yönelik algoritmadır. Çok sık alışveriş takiplerinde kullanılır. Örnek bir ürünü alan kullanıcıların yanında aldıkları ürünlerin yoğunluğuna göre diğer kullanıcılara ürün tavsiye edilmesi gibi.

Yarı Denetimli Öğrenme (Semi-supervised Learning)

Yarı denetimli makine öğrenmesi, denetimli öğrenmeye benzer, ancak bunun yerine hem etiketli hem de etiketsiz verileri kullanmaktadır. Etiketli veriler esasen anlamlı etiketlere sahip bilgilerdir, böylece etiketlenmemiş veriler bu bilgiden yoksundur ve algoritma verileri anlayabilmektedir. Bu kombinasyonu kullanarak, makine öğrenme algoritmaları etiketlenmemiş verileri etiketlemeyi öğrenebilir.

Soru 10-2

Rasyonel Ajan

Mümkün olan her algı dizisi için ve agent’in sahip olduğu bilgi dağarcığına göre, bir rasyonel ajan’ın performans seviyesini maksimum yapacak bir harekette bulunması beklenir. Rasyonellik her şeyi bilmekten farklıdır. Ajan’lar gerekli bilgileri alabilmek ve buna bağlı olarak algılarını değiştirmek için hareket sergilerler. Bir agent davranışlarını eğer kendi deneyimleri ile belirliyorsa otonomdur.

  • Doğru olanı yapan bir ajandır.

  • Doğru olanı yapmak burada ajan açısından en başarılı tepkiyi göstermek olarak düşünülebilir.

Belli bir anda rasyonel olan şeyler dört noktaya bağlıdır:

  • Başarıyı tanımlayan performans ölçümü ve derecesi

  • Ajanın şimdiye kadar algıladığı her şey

  • Ajanın çevresi hakkında sahip olduğu bilgi

  • Ajanın verebileceği tepkiler


Soru 10-3

Eğitim setinde x özellik vektörü, y ise karşılık gelen çıktı olarak tanımlanır


Soru 10-4

Yarı denetimli öğrenme metoduyla ilerlerdim.

Her ödev dosyası bir özellik vektörü olurdu

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment