Playing the Turkish tile game okey with deep reinforcement learning
Türk taş oyunu okeyi derin pekiştirmeli öğrenmeyle oynamak
- Tez No: 584975
- Danışmanlar: DR. ÖĞR. ÜYESİ AHMET ONUR DURAHİM
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2019
- Dil: İngilizce
- Üniversite: Boğaziçi Üniversitesi
- Enstitü: Sosyal Bilimler Enstitüsü
- Ana Bilim Dalı: Yönetim Bilişim Sistemleri Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 46
Özet
Geçtiğimiz yıllardan bu yana oyunlar makine öğrenmesi çalışmaları için önemli bir test yatağı olmaktadır. Satranç, Dama, Go ve Poker oyunlarında pekiştirmeleri öğrenme algoritmaları kapsamında derin yapay sinir ağlarıyla fonksiyon tahminlemeyle kayda değer ilerlemeler yapılmıştır. Yapay zekalar, oyunlarda dünyadaki en iyi insan oyuncuları yenerek şampiyon veya süper insan seviyelerine ulaşmıştır. Bu çalışma Türk taş oyunu Okey'e odaklanır ve derin pekiştirmeli öğrenmenin yönlendirmesiyle yapay zekanın bu oyunu öğrenebileceğini ispatlamayı amaçlar. Okey'in kısmi gözlemlenebilir ortamı, olasılıksal doğası ve birbirleriyle tam rekabet içinde olan oyuncularıyla kendine özgü bir yapısı vardır. Bu çalışma öğrenen bir yapay zekanın hiçbir doğrudan yönlendirme olmadan, sadece taş çekerken ve taş atarken her adımda ödül sinyalleri alarak, tez boyunca anlatılan olasılıksal davranış meyilleriyle, aktör-kritik algoritmasıyla, önceliklendirilmiş tecrübe tekrarlarıyla oyunu öğrenmesine odaklanmaktadır. Öğrenen yapay zeka, özel tasarlanmış 2 kişilik Okey'i Gym ortamında rastgele oynayan bilgisayar rakibine karşı oynar. Oyun çatısı içinde, öğrenen yapay zeka, yere atılan taşlardan ya da ortadaki taşlardan rastgele çeken ve her zaman elinde boşta olan taşlardan atan bilgisayar rakibine karşı oynar ve bu yapısı onu, öğrenen yapay zeka için yeterince zorlu kılar. Yapılan deneyler boyunca elde edilen sonuçlar bu çalışmada sunulmaktadır ve yapay zekanın rakibine karşı kazanma oranları bu çalışmanın elde ettiği başarı seviyesi olarak görülebilir. Literatürde yapılan kapsamlı araştırma sonucunda bu çalışma, pekiştirmeli öğrenme kullanılarak Okey oyununu oynatan ilk çalışma olarak gösterilebilir.
Özet (Çeviri)
Games are important test beds for machine learning studies for over the last decades. Significant progress has been made in games such as Checkers, Chess, Go and Poker with the help of deep neural networks used for function approximation within reinforcement learning algorithms. Agents were able to reach champion or superhuman levels by beating the top players of the world. This study focuses on the Turkish tile game Okey and aims to prove that agents can learn to play this game with the guidance of deep reinforcement learning. Okey has a unique setting where there is partially observable environment, stochastic nature and multiple players which are fully competitive. The study focuses on teaching a learning agent to play the game without any direct supervision, solely by receiving reward signals at each step for drawing and discarding tiles, with the help of stochastic policy gradients, actor-critic algorithm, prioritized experience replays which are explained thoroughly in this thesis. The learning agent plays against a random computer opponent in the custom Gym environment created for the Okey game as a two-player game version. Within the game framework, learning agent plays against an opponent that draws a tile from discarded tiles of the agent or from the center tile randomly, and always discards from the free tiles which makes it compelling enough for the learning agent. The results of the games through the experiments are reflected and win rates of the agent against the computer opponent can be considered as the achieved success of this study. Extensive research on the existing literature shows that this is the first study that uses reinforcement learning to play the game of Okey.
Benzer Tezler
- Isınma evresi esnasında uygulanan eğitsel oyunların performansa etkileri
The effects of educational games applied during the warm-up phase on performance
HALİM ÜÇÜNCÜ
Yüksek Lisans
Türkçe
2024
SporTrabzon ÜniversitesiBeden Eğitimi ve Spor Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ÇAĞLAR EDİS
- Osmanlı Sultanı II.Abdülhamid'in sanatçı kişiliği
The artistic personality of Ottoman Sultan Abdulhamid II
AYŞE ERSAY YÜKSEL
Doktora
Türkçe
2017
El SanatlarıAnkara Üniversitesiİslam Tarihi ve Sanatları Ana Bilim Dalı
PROF. DR. NUSRET ÇAM
- Basketbolcularda müsabakanın şut teknikleri üzerine etkisi
The effect of competition on shooting techniques in basketball players
BARIŞ ÖZ
Yüksek Lisans
Türkçe
2022
SporSelçuk ÜniversitesiAntrenörlük Eğitimi Ana Bilim Dalı
PROF. DR. HALİL TAŞKIN
- ZrO2-CaO-MgO-SiO2 (ZrCMS) firit esaslı, yüksek aşınma dayanımlı yer karosu sırlarının geliştirilmesi
Developing of high wearing resistance floor tile glazes based on the frit with ZrO2-CaO-MgO-SiO2 (ZrCMS)
ARZU GÖNÜL
Yüksek Lisans
Türkçe
2005
Seramik MühendisliğiAnadolu ÜniversitesiSeramik Mühendisliği Ana Bilim Dalı
DOÇ. DR. BEKİR KARASU
- 13.-14. yy. Anadolu'suna tarihlenen kandil ve şamdanlarda ışık sembolizmi
Başlık çevirisi yok
M. ELİF DURMUŞ