Training a bridge bidding agent using minimal feature engineering and deep reinforcement learning
Minimal öznitelik mühendisliği ve derin pekiştirmeli öğrenme kullanarak briç deklarasyon oyuncusu eğitimi
- Tez No: 667695
- Danışmanlar: PROF. DR. DENİZ YURET
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2020
- Dil: İngilizce
- Üniversite: Koç Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 67
Özet
Kontrakt briç, veya sadece briç, her biri iki oyuncudan oluşan iki ortaklığının birbiriyle rekabet ettiği kusurlu bilgili bir kart oyunudur. Oyun iki aşamadan oluşur: deklarasyon ve kart oyunu. Bilgisayar oyuncuları yirmi yıl önce oyun aşamasında insan seviyesinde performanslara ulaşmış olsalar da, deklarasyon aşaması hala zorlayıcı bir problem. Bu aşamada oyuncular, bir açık arttırmaya katılırken yalnızca kendi kartlarının bilgisine sahipler. Burada iyi performans göstermek, oyuncuların aksiyonları ile nasıl iletişim kuracaklarını belirleyip ortak bir kontrakta karar verebilmeyi gerektirir. Bu iletişim tekliflerin sürekli artma zorunluluğu ile limitli olup, rakip ortaklık da kendi teklifleri ile iletişimin arasına karışabilmektedirler. Bu tezde, minimum öznitelik mühendisliğine sahip birkaç yeni mimari ile deney yapıyoruz ve bunları uzman düzeyindeki insan oyunlarından oluşan bir veri kümesi ile gözetimli eğitim kullanarak değerlendiriyoruz. Bundan sonra, elde edilen modeli gerçek oyun oynanışları ile iyileştirmek için farklı derin pekiştirmeli öğrenme biçimlerini inceliyoruz. Son olarak, rakipli briç oyuncuları için rekabet etmek için ayrı bir oyuncu gerektirmeyen bir değerlendirme ölçütü öneriyoruz.
Özet (Çeviri)
The game of contract bridge, or just bridge, is a four-player imperfect information card game where two partnerships of two players compete against each other. It has two main phases: bidding and play. While the computer players have approached human-level performance two decades ago in the playing phase, bidding is still a very challenging problem. This makes bridge one of the last popular games where computers still lag behind the expert human-level performance. During bidding, players only know their own cards while participating in a public auction. Performing well in this phase requires the players to figure out how to communicate with their partners using the limited vocabulary of bids to decide on a joint contract. This communication is restricted by the strict ordering of legal bids and can be negatively interfered by bids made by the opponent partnership. In this thesis, we experiment with several novel architectures with minimal feature engineering and evaluate them by using supervised training over a data set of expert-level human games. After that, we further study different forms of deep reinforcement learning to refine the resulting model by simulated gameplay. Lastly, we propose an oracle evaluation metric that can measure the quality of any bidding sequence with respect to the game-theoretical optimum.
Benzer Tezler
- Conceptual design of unmanned aerial vehicle
İnsansız hava aracı kavramsal tasarımı
HEYZEM DOĞUKAN DELİBAŞ
Yüksek Lisans
İngilizce
2021
Savunma ve Savunma Teknolojileriİstanbul Teknik ÜniversitesiSavunma Teknolojileri Ana Bilim Dalı
DR. ÖĞR. ÜYESİ HAYRİ ACAR
- Galim Jaylibay'ın seçilmiş şiirleri üzerinde dil ve üslup incelemesi
A study of language and style in Galim Jaylibay's poems
SAMET ÖNDER
Yüksek Lisans
Türkçe
2021
Türk Dili ve EdebiyatıPamukkale ÜniversitesiÇağdaş Türk Lehçeleri ve Edebiyatları Ana Bilim Dalı
PROF. DR. NERGİS BİRAY
- Yüksek hızlı sayısal abone hatlarının (HDSL) incelenmesi
High bit rate digital subscriber lines (HDSL)
M.MUSTAFA GÜNDÜZ
Yüksek Lisans
Türkçe
1995
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiPROF.DR. GÜNSEL DURUSOY
- A distant implementation of inset: A teacher training platform for contextual grammar teaching
Bir uzaktan hizmetiçi eğitimi uygulaması: Bağlamsal dilbilgisi öğretiminde öğretmen eğitimi ortamı
DÖNERCAN DÖNÜK
Doktora
İngilizce
2012
Eğitim ve ÖğretimÇukurova Üniversitesiİngiliz Dili Eğitimi Ana Bilim Dalı
YRD. DOÇ. DR. CEM CAN