Geri Dön

Training a bridge bidding agent using minimal feature engineering and deep reinforcement learning

Minimal öznitelik mühendisliği ve derin pekiştirmeli öğrenme kullanarak briç deklarasyon oyuncusu eğitimi

  1. Tez No: 667695
  2. Yazar: ULAŞ SERT
  3. Danışmanlar: PROF. DR. DENİZ YURET
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2020
  8. Dil: İngilizce
  9. Üniversite: Koç Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 67

Özet

Kontrakt briç, veya sadece briç, her biri iki oyuncudan oluşan iki ortaklığının birbiriyle rekabet ettiği kusurlu bilgili bir kart oyunudur. Oyun iki aşamadan oluşur: deklarasyon ve kart oyunu. Bilgisayar oyuncuları yirmi yıl önce oyun aşamasında insan seviyesinde performanslara ulaşmış olsalar da, deklarasyon aşaması hala zorlayıcı bir problem. Bu aşamada oyuncular, bir açık arttırmaya katılırken yalnızca kendi kartlarının bilgisine sahipler. Burada iyi performans göstermek, oyuncuların aksiyonları ile nasıl iletişim kuracaklarını belirleyip ortak bir kontrakta karar verebilmeyi gerektirir. Bu iletişim tekliflerin sürekli artma zorunluluğu ile limitli olup, rakip ortaklık da kendi teklifleri ile iletişimin arasına karışabilmektedirler. Bu tezde, minimum öznitelik mühendisliğine sahip birkaç yeni mimari ile deney yapıyoruz ve bunları uzman düzeyindeki insan oyunlarından oluşan bir veri kümesi ile gözetimli eğitim kullanarak değerlendiriyoruz. Bundan sonra, elde edilen modeli gerçek oyun oynanışları ile iyileştirmek için farklı derin pekiştirmeli öğrenme biçimlerini inceliyoruz. Son olarak, rakipli briç oyuncuları için rekabet etmek için ayrı bir oyuncu gerektirmeyen bir değerlendirme ölçütü öneriyoruz.

Özet (Çeviri)

The game of contract bridge, or just bridge, is a four-player imperfect information card game where two partnerships of two players compete against each other. It has two main phases: bidding and play. While the computer players have approached human-level performance two decades ago in the playing phase, bidding is still a very challenging problem. This makes bridge one of the last popular games where computers still lag behind the expert human-level performance. During bidding, players only know their own cards while participating in a public auction. Performing well in this phase requires the players to figure out how to communicate with their partners using the limited vocabulary of bids to decide on a joint contract. This communication is restricted by the strict ordering of legal bids and can be negatively interfered by bids made by the opponent partnership. In this thesis, we experiment with several novel architectures with minimal feature engineering and evaluate them by using supervised training over a data set of expert-level human games. After that, we further study different forms of deep reinforcement learning to refine the resulting model by simulated gameplay. Lastly, we propose an oracle evaluation metric that can measure the quality of any bidding sequence with respect to the game-theoretical optimum.

Benzer Tezler

  1. Conceptual design of unmanned aerial vehicle

    İnsansız hava aracı kavramsal tasarımı

    HEYZEM DOĞUKAN DELİBAŞ

    Yüksek Lisans

    İngilizce

    İngilizce

    2021

    Savunma ve Savunma Teknolojileriİstanbul Teknik Üniversitesi

    Savunma Teknolojileri Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ HAYRİ ACAR

  2. Galim Jaylibay'ın seçilmiş şiirleri üzerinde dil ve üslup incelemesi

    A study of language and style in Galim Jaylibay's poems

    SAMET ÖNDER

    Yüksek Lisans

    Türkçe

    Türkçe

    2021

    Türk Dili ve EdebiyatıPamukkale Üniversitesi

    Çağdaş Türk Lehçeleri ve Edebiyatları Ana Bilim Dalı

    PROF. DR. NERGİS BİRAY

  3. Bağlama eğitiminde görülen problemler ve bunların çözüm yolları

    Başlık çevirisi yok

    ADNAN KOÇ

    Sanatta Yeterlik

    Türkçe

    Türkçe

    2000

    Müzikİstanbul Teknik Üniversitesi

    Müzik Ana Bilim Dalı

    PROF. DR. CAN ETİLİ

  4. Yüksek hızlı sayısal abone hatlarının (HDSL) incelenmesi

    High bit rate digital subscriber lines (HDSL)

    M.MUSTAFA GÜNDÜZ

    Yüksek Lisans

    Türkçe

    Türkçe

    1995

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    PROF.DR. GÜNSEL DURUSOY

  5. A distant implementation of inset: A teacher training platform for contextual grammar teaching

    Bir uzaktan hizmetiçi eğitimi uygulaması: Bağlamsal dilbilgisi öğretiminde öğretmen eğitimi ortamı

    DÖNERCAN DÖNÜK

    Doktora

    İngilizce

    İngilizce

    2012

    Eğitim ve ÖğretimÇukurova Üniversitesi

    İngiliz Dili Eğitimi Ana Bilim Dalı

    YRD. DOÇ. DR. CEM CAN