Geri Dön

Learning a partially observable card game hearts using reinforcement learning

Yarı gözlemlenebilir maça kızı kart oyununu takviyeli öğrenme metodu ile öğrenme

  1. Tez No: 630657
  2. Yazar: BUĞRA KAAN DEMİRDÖVER
  3. Danışmanlar: PROF. DR. FERDA NUR ALPASLAN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2020
  8. Dil: İngilizce
  9. Üniversite: Orta Doğu Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 74

Özet

Günümüzde yapay zeka ve makine ög ̆renmesi bir çok sektörde popülerler. Bu sektör- lerden bir tanesi oyun sektörü. Oyun sektörü çok farklı senaryolar, farklı oyun türleri ile yapay zeka ve makine ög ̆renmesine önemli bir çalıs ̧ma alanı sag ̆lıyor. Bu çalıs ̧- manın amacı Maça Kızı oynamayı ög ̆renen yapay zeka birimleri gelis ̧tirmektir. Maça kızı tüm dünyada en çok popüler olan kart oyunlarından bir tanesidir. Maça kızı sıra tabanlı, yarı gözlemlenebilir bir kart oyunudur. Maça kızı büyük bir durum alanına sahip olmasının yanında bir çok ekstra zorlug ̆u da beraberinde getirmektedir. Bu zor- luklar oyunun, dig ̆er kart oyunlarından farklı kuralları dolayısıyla dog ̆maktadır. Bu çalıs ̧mada zorlukları bir bütün olarak çözülmek yerine küçük parçalara ayrılıp kolay- las ̧tırılmıs ̧tır. Her bir küçük parça farklı bir yapay zeka birimi tarafından zamansal fark ög ̆renimi yöntemiyle ög ̆renilmis ̧tir.

Özet (Çeviri)

Artificial intelligence and machine learning are widely popular in many sectors. One of them is the gaming industry. With many different scenarios, different types, games are perfect for machine learning and artificial intelligence. This study aims to develop learning agents to play the game of Hearts. Hearts is one of the most popular card games in the world. It is a trick based, imperfect information card game. In addition to having a huge state space, hearts offers many extra challenges due to the nature of the game. These challenges are divided into smaller parts where learning is easier and assigned to different learning agents. These agents use temporal difference learning to learn assigned parts.

Benzer Tezler

  1. Deep reinforcement learning for partially observable markov decision processes

    Kısmi gözlemlenebilir markov karar süreçleri için derin pekiştirmeli öğrenme

    MEHMET HAKLIDIR

    Doktora

    İngilizce

    İngilizce

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Kontrol ve Otomasyon Mühendisliği Ana Bilim Dalı

    PROF. DR. HAKAN TEMELTAŞ

  2. Çoklu eleman takviyeli öğrenmeye veri madenciliği tabanlı yeni yaklaşımlar

    Data mining based novel approaches to multiagent reinforcement learning

    MEHMET KAYA

    Doktora

    Türkçe

    Türkçe

    2003

    Elektrik ve Elektronik MühendisliğiFırat Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    DOÇ. DR. AHMET ARSLAN

  3. Keyframe demonstration seeded and Bayesian optimized policy search

    Anahtar nokta gösterimlerinden desteklenerek başlatılmış ve Bayessel optimize edilmiş politika öğrenimi

    ONUR BERK TÖRE

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKoç Üniversitesi

    Bilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ BARIŞ AKGÜN

  4. İnsansız hava araçlarında kolektif zeka uygulaması

    Collective intelligence application in unmanned air vehicles

    FATİH AYDEMİR

    Doktora

    Türkçe

    Türkçe

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. AYDIN ÇETİN

  5. Implementation of continuous POMDP algorithms on autonomous robots

    Otonom robotlar üzerinde sürekli KGMKS algoritmalarının uygulanması

    DERYA SEZEN

    Yüksek Lisans

    İngilizce

    İngilizce

    2008

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi Üniversitesi

    Bilgisayar Mühendisliği Bölümü

    PROF. DR. H. LEVENT AKIN