TD-Gammon revisited: integrating invalid actions and dice factor in continuous action and observation space
TD-Gammon'a yeniden bakış: tavla'da sürekli aksiyon ve gözlem alanı içine geçersiz hamleleri ve zar faktörünü dahil etmek
- Tez No: 521398
- Danışmanlar: PROF. DR. FERDANUR ALPASLAN
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2018
- Dil: İngilizce
- Üniversite: Orta Doğu Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 57
Özet
TD-Gammon'un 1991'deki başarısından sonra, oyun oynyabilen etmenlere olan ilgi bir hayli artmış durumda. Derin Öğrenme ve eski oyunların emülatörlerindeki gelişmelerden sonra, Atari oyunları için insan seviyesinde oynayabilen etmenler ortaya çıktı, ve Derin Takviyeli Öğrenme kendi başarısını kanıtladı. Ancak, Derin Takviyeli Öğrenme'nin atası olan TD-Gammon, ve ounu Tavla, arka planda kaldı. Bunun sebepleri ise, Tavla'nın aksiyonlarının diğer Atari oyunlarına göre çok daha kompleks olması (genelde çoğu Atari oyununda 2 veya 4 farklı aksiyon alınabilir), aksiyon alanında çok fazla geçersiz aksiyon olması, ve zar faktörünün getirdiği rastgelelik olarak görülüyor. Son sebep olarak ise, Tavla'da uzun süre önce profesyonel seviyede oynayabilen etmenlerin varlığı olduğunu söyleyebiliriz. Bu tezde, son çıkan Derin Takviyeli Öğrenme yöntemleri, onların atası olan oyuna, Tavla'ya karşı test edilecektir. Bu sırada ek olarak, etmenlerimiz zar faktörünü de hesaba katarak geçerli hamleleri bulmaya çalışacaktır.
Özet (Çeviri)
After TD-Gammon's success in 1991, the interest in game-playing agents has risen significantly. With the developments in Deep Learning and emulations for older games have been created, human-level control for Atari games has been achieved and Deep Reinforcement Learning has proven itself to be a success. However, the ancestor of DRL, TD-Gammon, and its game Backgammon got out of sight, because of the fact that Backgammon's actions are much more complex than other games (most of the Atari games has 2 or 4 different actions), the huge action space has much invalid actions, and there is a dice factor which involves stochasticity. Last but not least, the professional level in Backgammon has been achieved a long time ago. In this thesis, the latest methods in DRL will be tested against its ancestor game, Backgammon, while trying to teach how to select valid moves and considering the dice factor.
Benzer Tezler
- Aşçıların besin hazırlama, pişirme ve saklama teknikleri konusunda aldıkları eğitimin etkinliğinin değerlendirilmesi
Effectiveness assessment of nutrition training provided for cooks on food preparation, cooking and preservation methods
AYSUN ORHAN
Yüksek Lisans
Türkçe
2015
Halk Sağlığıİstanbul ÜniversitesiHalk Sağlığı Ana Bilim Dalı
PROF. DR. GÜNAY GÜNGÖR
- TD 1070 numaralı Edirne Evkâf Defteri
Fiscal surveys, number 1070, Edirne foundation book
YILMAZ ÇETİNER
- Kültürlerarası evliliklerde çatışma ve uyum: Alanya örneği
Conflict and harmony in intercultural marriages: The case of Alanya
HATİCE ERSOY ÇELİK
Yüksek Lisans
Türkçe
2020
SosyolojiAfyon Kocatepe ÜniversitesiSosyoloji Ana Bilim Dalı
DR. ÖĞR. ÜYESİ BEDİR SALA
- Use of non-conventional time domain (TD) NMR approachesfor characterisation of gelatin based soft candies
Jelatin tabanlı yumuşak şekerlemelerin karakterizasyonunda geleneksel olmayan zamansal alanda NMR yaklaşımlarının kullanılması
ŞİRVAN SULTAN UĞUZ
Yüksek Lisans
İngilizce
2020
Gıda MühendisliğiOrta Doğu Teknik ÜniversitesiGıda Mühendisliği Ana Bilim Dalı
DOÇ. DR. HALİL MECİT ÖZTOP
DR. ÖĞR. ÜYESİ EMİN BURÇİN ÖZVURAL
- PET/BT görüntülemenin gastrointestinal kanserli hastalarda peritoneal karsinomatozis saptama ve kanser evrelemesindeki rolü
The role of PET/CT imaging in cancer staging and detection ofperitoneal carcinomatosis in patients with gastrointestinal cancer
HASAN PALA
Tıpta Uzmanlık
Türkçe
2025
GastroenterolojiHacettepe ÜniversitesiNükleer Tıp Ana Bilim Dalı
PROF. DR. ÖMER UĞUR