Learning a partially observable card game hearts using reinforcement learning
Yarı gözlemlenebilir maça kızı kart oyununu takviyeli öğrenme metodu ile öğrenme
- Tez No: 630657
- Danışmanlar: PROF. DR. FERDA NUR ALPASLAN
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2020
- Dil: İngilizce
- Üniversite: Orta Doğu Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 74
Özet
Günümüzde yapay zeka ve makine ög ̆renmesi bir çok sektörde popülerler. Bu sektör- lerden bir tanesi oyun sektörü. Oyun sektörü çok farklı senaryolar, farklı oyun türleri ile yapay zeka ve makine ög ̆renmesine önemli bir çalıs ̧ma alanı sag ̆lıyor. Bu çalıs ̧- manın amacı Maça Kızı oynamayı ög ̆renen yapay zeka birimleri gelis ̧tirmektir. Maça kızı tüm dünyada en çok popüler olan kart oyunlarından bir tanesidir. Maça kızı sıra tabanlı, yarı gözlemlenebilir bir kart oyunudur. Maça kızı büyük bir durum alanına sahip olmasının yanında bir çok ekstra zorlug ̆u da beraberinde getirmektedir. Bu zor- luklar oyunun, dig ̆er kart oyunlarından farklı kuralları dolayısıyla dog ̆maktadır. Bu çalıs ̧mada zorlukları bir bütün olarak çözülmek yerine küçük parçalara ayrılıp kolay- las ̧tırılmıs ̧tır. Her bir küçük parça farklı bir yapay zeka birimi tarafından zamansal fark ög ̆renimi yöntemiyle ög ̆renilmis ̧tir.
Özet (Çeviri)
Artificial intelligence and machine learning are widely popular in many sectors. One of them is the gaming industry. With many different scenarios, different types, games are perfect for machine learning and artificial intelligence. This study aims to develop learning agents to play the game of Hearts. Hearts is one of the most popular card games in the world. It is a trick based, imperfect information card game. In addition to having a huge state space, hearts offers many extra challenges due to the nature of the game. These challenges are divided into smaller parts where learning is easier and assigned to different learning agents. These agents use temporal difference learning to learn assigned parts.
Benzer Tezler
- Deep reinforcement learning for partially observable markov decision processes
Kısmi gözlemlenebilir markov karar süreçleri için derin pekiştirmeli öğrenme
MEHMET HAKLIDIR
Doktora
İngilizce
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiKontrol ve Otomasyon Mühendisliği Ana Bilim Dalı
PROF. DR. HAKAN TEMELTAŞ
- Çoklu eleman takviyeli öğrenmeye veri madenciliği tabanlı yeni yaklaşımlar
Data mining based novel approaches to multiagent reinforcement learning
MEHMET KAYA
Doktora
Türkçe
2003
Elektrik ve Elektronik MühendisliğiFırat ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
DOÇ. DR. AHMET ARSLAN
- Keyframe demonstration seeded and Bayesian optimized policy search
Anahtar nokta gösterimlerinden desteklenerek başlatılmış ve Bayessel optimize edilmiş politika öğrenimi
ONUR BERK TÖRE
Yüksek Lisans
İngilizce
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKoç ÜniversitesiBilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ BARIŞ AKGÜN
- İnsansız hava araçlarında kolektif zeka uygulaması
Collective intelligence application in unmanned air vehicles
FATİH AYDEMİR
Doktora
Türkçe
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. AYDIN ÇETİN
- Implementation of continuous POMDP algorithms on autonomous robots
Otonom robotlar üzerinde sürekli KGMKS algoritmalarının uygulanması
DERYA SEZEN
Yüksek Lisans
İngilizce
2008
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi ÜniversitesiBilgisayar Mühendisliği Bölümü
PROF. DR. H. LEVENT AKIN