Geri Dön

Multi agent reinforcement learning using function approximation

Fonksiyon yaklaşımı kullanarak çoklu etmen takviye öğrenme

  1. Tez No: 82462
  2. Yazar: OSMAN ABUL
  3. Danışmanlar: DOÇ. DR. FARUK POLAT
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Takviye Öğrenme, AFCW, Çoklu-Etmen Öğrenme, Koordinasyon, Fonksiyon Yaklaşımı iv, Reinforcement Learning, AFCW, Multi-Agent Learning, Cooperation, Function Approximation 111
  7. Yıl: 1999
  8. Dil: İngilizce
  9. Üniversite: Orta Doğu Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 67

Özet

oz FONKSİYON YAKLAŞIMI KULLANARAK ÇOKLU-ETMEN TAKVİYE ÖĞRENME Abul, Osman Yüksek Lisans, Bilgisayar Mühendisliği Bölümü Tez Yöneticisi: Doç. Dr. Faruk Polat Ağustos 1999, 67 sayfa Düşmanca unsurların bulunduğu bir ortamda öğrenme ve çevreye uyum önem kazanmaktadır. Eğer etmenler yaşadıkları çevrenin dinamikleri hakkında çok az bilgiye sahipseler takviye öğrenme tekniklerini kullanabilirler. Bu tezde düşmanca bir ortam olan AFCW'de takviye öğrenme teknikleri üzerinde çalışılmıştır. AFCW'de yaşayan etmenler yaşamak için öğrenmek zorundadır. Bunun yanında çoklu-etmen AFCW'de etmenler yaşamayı daha kolay hale getirmek için koordinasyona ihtiyaç duyarlar. Etmenler arasında açık iletişim gerektirmeyen iki tane koordinasyon yöntemi sunulmuştur. AFCW, çok büyük durum uzayına sahiptir, dolayısıyla öğrenilen bilginin saklandığı geleneksel bakma tabloları yetersiz kalmaktadır. Büyük ölçüler için fonksiyon yaklaşımı ve genelleme metodları kullanılmıştır. Çok sayıda fonksiyon yaklaşımı mimarisi ve takviye öğrenme algoritması ile deney yapılmıştır. Hem tek-etmen hem de çoklu-etmen AFCW için deney sonuçları sunulmuştur.

Özet (Çeviri)

ABSTRACT MULTI-AGENT REINFORCEMENT LEARNING USING FUNCTION APPROXIMATION Abul, Osman M.S., Department of Computer Engineering Supervisor: Assoc. Prof. Dr. Faruk Polat August 1999, 67 pages Learning and adaptation become more important for agents living in hostile environments. Agents can use reinforcement learning techniques if they have little information about dynamics of their environment. In this thesis, we have studied reinforcement learning techniques in a dynamic hostile environment (AFCW). The agents in AFCW need to learn to survive. Besides, the agents in multi-agent AFCW need to cooperate for making the task easier. Two cooperation methods that don't require explicit communication among agents are presented. The AFCW domain has huge state space, so traditional lookup tables are insufficient to store acquired knowledge. Function approximation and generalization methods are used for scaling up. We have experimented with various function approximation architectures and reinforcement learning algorithms. The experimental results for both single-agent and multi-agent AFCW environments are presented.

Benzer Tezler

  1. Reinforcement learning of multi-agent team behavior

    Çoklu-etmen takım davranışlarının pekiştirmeli öğrenilmesi

    MEHMET UTKU TATLIDEDE

    Yüksek Lisans

    İngilizce

    İngilizce

    2003

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. LEVENT AKIN

  2. A heterogeneous multi agent intelligent player for a real-time strategy game

    Gerçek zamanlı strateji oyunu için heterojen çoklu etmenler kullanan akıllı oyuncu

    MEHMET CİHAN KURT

    Yüksek Lisans

    İngilizce

    İngilizce

    2010

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolMarmara Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. MUSTAFA BORAHAN TÜMER

  3. Çizge ve içerik verilerinde kolektif sınıflandırma algoritmalarının karşılaştırılması

    A comparison of collective classification techniques on network and content data

    ÖZGE ATASEVEN

    Yüksek Lisans

    Türkçe

    Türkçe

    2017

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. YUSUF YASLAN

  4. Etmenlerin iç modelini kullanarak çoklu etmenlerde bulanık takviyeli öğrenme

    Fuzzy reinforcement learning in multi-agent systems using internal model of agents

    ALPER KILIÇ

    Yüksek Lisans

    Türkçe

    Türkçe

    2002

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolFırat Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ.DR. AHMET ARSLAN

  5. IQ-flow: Mechanism design for inducing cooperative behavior to self-interested agents in sequential social dilemmas

    TQ-akışı: Ardışıl sosyal ikilemlerdeki çıkarcı etmenleri işbirlikçi davranışa teşvik etmek için mekanizma tasarımı

    BENGİSU GÜRESTİ

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. NAZIM KEMAL ÜRE