Geri Dön

Learning cooperation in hunter-prey problem via state abstraction

Av avcı probleminde durum soyutlama yoluyla işbirliği öğrenme

  1. Tez No: 238621
  2. Yazar: ATIL İŞÇEN
  3. Danışmanlar: PROF. DR. FARUK POLAT
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2009
  8. Dil: İngilizce
  9. Üniversite: Orta Doğu Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Bölümü
  12. Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  13. Sayfa Sayısı: 52

Özet

Avcı av problemi Pekiştirmeli Öğrenme yöntemi için sıkça kullanılan bir deney alanıdır, ancak durum uzayı hacminin büyüklüğü ajan sayısına ve ortamın büyüklüğüne üstel bağlı olarak değişmektedir. Durum uzayının bu büyüklüğü standart Q-öğrenme algoritmasının kullanımını imkansız kıldığından, bu tez daha önce öğrenilmiş bilgiyi kullanıp daha büyük deney ortamlarında çalışabilen ajanlar üreterek, durum uzayı büyüklüğünün sabit tutmayı sağlayan bir yöntem tanıtmaktadır. Bu metot, Hiyerarşik Pekiştirmeli Öğrenme yöntemlerinden esinlenerek görevi daha basit alt görev seçimlerine bölen paralel alt görev mekanizmasından, bu yönteme yönelik bir durum gösterim tekniğinden ve bunun daha büyük ortamlar için genişletiminden oluşmaktadır. Deneysel sonuçlar önerilen yöntemin ortam parametrelerinden bağımsız, sabit büyüklükte bir durum uzayı kullanarak, el ile yazılmış algoritma kullanan ajanlara yakın, başarılı sonuçlar elde ettiğini göstermektedir.

Özet (Çeviri)

Hunter-Prey or Prey-Pursuit problem is a common toy domain for Reinforcement Learning, but the size of the state space is exponential in the parameters such as size of the grid or number of agents. As the size of the state space makes the flat Q-learning impossible to use for different scenarios, this thesis presents an approach to make the size of the state space constant by producing agents that use previously learned knowledge to perform on bigger scenarios containing more agents. Inspired from HRL methods, the method is composed of a parallel subtasks schema dividing the task into choices of simpler subtasks, a state representation technique convenient for this schema and its extension for bigger grids. Experimental results show that proposed method successfully provides agents that perform near to hand-coded agents by using constant sized state space independent from parameters of the domain.

Benzer Tezler

  1. 2 LRL: A two-level multi-agent reinforcement learning algorithm with communication

    2 LRL: Bir iki seviyeli iletişimli çoklu-etmen takviye öğrenme metodu

    GÜRAY ERUS

    Yüksek Lisans

    İngilizce

    İngilizce

    2002

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik Üniversitesi

    Bilişim Sistemleri Ana Bilim Dalı

    PROF.DR. FARUK POLAT

  2. İktisadi ve İdari Bilimler Fakülteleri ve İşletme Fakültelerinin Endüstri 4.0 ile dönüşümü

    Transformation of Faculties of Economics and Administrative Sciences and Faculties of Business Administration with Industry 4.0

    AYŞEGÜL SAĞLAM

    Yüksek Lisans

    Türkçe

    Türkçe

    2022

    İşletmeKaradeniz Teknik Üniversitesi

    İşletme Ana Bilim Dalı

    PROF. DR. TÜLAY İLHAN NAS

  3. İlköğretim müzik derslerinde blok flüt eğitiminin yeri

    Başlık çevirisi yok

    SALİME AKBABA TAKMAZ

    Yüksek Lisans

    Türkçe

    Türkçe

    1997

    Eğitim ve Öğretimİstanbul Teknik Üniversitesi

    YRD. DOÇ. DR. NURLU EROL

  4. İdeal olmayan da-da düşürücü dönüştürücüler için optimal kesir dereceli pıd denetleyici tasarımı

    Optimal fractional order pid controller design for non-ideal dc-dc buck converters

    CİHAN ERSALI

    Doktora

    Türkçe

    Türkçe

    2024

    Elektrik ve Elektronik MühendisliğiBatman Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    DOÇ. DR. BARAN HEKİMOĞLU

  5. İmalat sistemlerinin tasarlanması ve öncelik kurallarının belirlenmesinde yapay sinir ağlarının kullanılması

    Başlık çevirisi yok

    TARIK ÇAKAR

    Doktora

    Türkçe

    Türkçe

    1997

    Mühendislik Bilimleriİstanbul Teknik Üniversitesi

    İşletme Mühendisliği Ana Bilim Dalı

    PROF. DR. AYHAN TORAMAN