Genel Bakış


Destekli Öğrenim ortamdaki etkileşimleri ödüllendirme veya cezalandırmaya dayalı olarak eylemde bulunmayı öğretme tekniğidir. DÖ'de, bir etmenin çevre içindeki bir dizi eylemi takip ettiğini ve etmenin performansına bağlı olarak, etmene bir ödül (veya ceza) verildiğini ve söz konusu ödül/cezaya göre, etmen yaptığı eylemleri değiştirdiğini hatırlayın.

Solitaire gibi mekana karşı bir temsilcinin oyununu düşünün; temsilci mekana "karşı" birçok kez oynayabilir ve temsilciye özel eğitimi hedeflemek için mekanı değiştirebiliriz (zorluğu, rastgeleleştirmeyi vb. değiştirebiliriz). AI Arena gibi birden fazla oyuncunun yer aldığı rekabetçi oyunlara ne dersiniz?

Kendi Başına Oynamaya Neden İhtiyacımız Var?


Rakibi mekanın bir parçası olarak düşünerek ve temsilcinizi, rakibe karşı odaklamak mümkündür; örneğin, kurallara dayalı bir dövüşçüyü kodlayabilir ve DÖ temsilcinizi söz konusu dövüşçüye karşı eğitebilirsiniz. Bununla birlikte, bu yöntemin sınırlı bir faydası vardır. Bunun birçok nedeni var, ancak üç ana neden:

Temsilcimiz antrenman yaptıkça otomatik olarak değişen tek bir dinamik rakip yaratmanın bir yolu var mı?

Evet var! Neden bir temsilciyi kendine karşı eğitmiyorsun?

Kendi Başına Oynama Nedir?


Kendi başına oynama tam olarak adından da anlaşılacağı gibi: DÖ eğitiminde temsilcinizi kendisiyle karşı karşıya getirmek. Kendi başına oyunda temsilciniz kopyalanır ve her iki temsilci de birbirine karşı antrenman yapar. Temsilciler, her simülasyonda dönüşümlü olarak güncellenir.

Bu şekilde temsilciniz, stratejisi değişen ve aynı güç seviyesinde olan dinamik bir rakiple eşleştirilecektir. Zamanla temsilciniz yeni, belki de "insanüstü" stratejiler bile ortaya çıkarabilir!

<aside> ⬅️ Önceki

</aside>

<aside> ➡️ Sonraki

</aside>