TD-Gammon revisited: integrating invalid actions and dice factor in continuous action and observation space

TD-Gammon'a yeniden bakış: tavla'da sürekli aksiyon ve gözlem alanı içine geçersiz hamleleri ve zar faktörünü dahil etmek

PDF İndir

Tez No: 521398
Yazar: ENGİN DENİZ USTA
Danışmanlar: PROF. DR. FERDANUR ALPASLAN
Tez Türü: Yüksek Lisans
Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
Anahtar Kelimeler: Belirtilmemiş.
Yıl: 2018
Dil: İngilizce
Üniversite: Orta Doğu Teknik Üniversitesi
Enstitü: Fen Bilimleri Enstitüsü
Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
Bilim Dalı: Belirtilmemiş.
Sayfa Sayısı: 57

Özet

TD-Gammon'un 1991'deki başarısından sonra, oyun oynyabilen etmenlere olan ilgi bir hayli artmış durumda. Derin Öğrenme ve eski oyunların emülatörlerindeki gelişmelerden sonra, Atari oyunları için insan seviyesinde oynayabilen etmenler ortaya çıktı, ve Derin Takviyeli Öğrenme kendi başarısını kanıtladı. Ancak, Derin Takviyeli Öğrenme'nin atası olan TD-Gammon, ve ounu Tavla, arka planda kaldı. Bunun sebepleri ise, Tavla'nın aksiyonlarının diğer Atari oyunlarına göre çok daha kompleks olması (genelde çoğu Atari oyununda 2 veya 4 farklı aksiyon alınabilir), aksiyon alanında çok fazla geçersiz aksiyon olması, ve zar faktörünün getirdiği rastgelelik olarak görülüyor. Son sebep olarak ise, Tavla'da uzun süre önce profesyonel seviyede oynayabilen etmenlerin varlığı olduğunu söyleyebiliriz. Bu tezde, son çıkan Derin Takviyeli Öğrenme yöntemleri, onların atası olan oyuna, Tavla'ya karşı test edilecektir. Bu sırada ek olarak, etmenlerimiz zar faktörünü de hesaba katarak geçerli hamleleri bulmaya çalışacaktır.

Özet (Çeviri)

After TD-Gammon's success in 1991, the interest in game-playing agents has risen significantly. With the developments in Deep Learning and emulations for older games have been created, human-level control for Atari games has been achieved and Deep Reinforcement Learning has proven itself to be a success. However, the ancestor of DRL, TD-Gammon, and its game Backgammon got out of sight, because of the fact that Backgammon's actions are much more complex than other games (most of the Atari games has 2 or 4 different actions), the huge action space has much invalid actions, and there is a dice factor which involves stochasticity. Last but not least, the professional level in Backgammon has been achieved a long time ago. In this thesis, the latest methods in DRL will be tested against its ancestor game, Backgammon, while trying to teach how to select valid moves and considering the dice factor.

Benzer Tezler

Tez No
412479
Aşçıların besin hazırlama, pişirme ve saklama teknikleri konusunda aldıkları eğitimin etkinliğinin değerlendirilmesi
Effectiveness assessment of nutrition training provided for cooks on food preparation, cooking and preservation methods
AYSUN ORHAN
Yüksek Lisans
Türkçe
2015
Halk Sağlığı İstanbul Üniversitesi
Halk Sağlığı Ana Bilim Dalı
PROF. DR. GÜNAY GÜNGÖR
Tez No
253491
TD 1070 numaralı Edirne Evkâf Defteri
Fiscal surveys, number 1070, Edirne foundation book
YILMAZ ÇETİNER
Yüksek Lisans
Türkçe
2009
Tarih Muğla Üniversitesi
Tarih Bölümü
YRD. DOÇ. DR. AHMET YİĞİT
Tez No
637878
Kültürlerarası evliliklerde çatışma ve uyum: Alanya örneği
Conflict and harmony in intercultural marriages: The case of Alanya
HATİCE ERSOY ÇELİK
Yüksek Lisans
Türkçe
2020
Sosyoloji Afyon Kocatepe Üniversitesi
Sosyoloji Ana Bilim Dalı
DR. ÖĞR. ÜYESİ BEDİR SALA
Tez No
640878
Use of non-conventional time domain (TD) NMR approachesfor characterisation of gelatin based soft candies
Jelatin tabanlı yumuşak şekerlemelerin karakterizasyonunda geleneksel olmayan zamansal alanda NMR yaklaşımlarının kullanılması
ŞİRVAN SULTAN UĞUZ
Yüksek Lisans
İngilizce
2020
Gıda Mühendisliği Orta Doğu Teknik Üniversitesi
Gıda Mühendisliği Ana Bilim Dalı
DOÇ. DR. HALİL MECİT ÖZTOP
DR. ÖĞR. ÜYESİ EMİN BURÇİN ÖZVURAL
Tez No
957560
PET/BT görüntülemenin gastrointestinal kanserli hastalarda peritoneal karsinomatozis saptama ve kanser evrelemesindeki rolü
The role of PET/CT imaging in cancer staging and detection ofperitoneal carcinomatosis in patients with gastrointestinal cancer
HASAN PALA
Tıpta Uzmanlık
Türkçe
2025
Gastroenteroloji Hacettepe Üniversitesi
Nükleer Tıp Ana Bilim Dalı
PROF. DR. ÖMER UĞUR

Geri Dön