Multi agent reinforcement learning using function approximation
Fonksiyon yaklaşımı kullanarak çoklu etmen takviye öğrenme
- Tez No: 82462
- Danışmanlar: DOÇ. DR. FARUK POLAT
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Takviye Öğrenme, AFCW, Çoklu-Etmen Öğrenme, Koordinasyon, Fonksiyon Yaklaşımı iv, Reinforcement Learning, AFCW, Multi-Agent Learning, Cooperation, Function Approximation 111
- Yıl: 1999
- Dil: İngilizce
- Üniversite: Orta Doğu Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 67
Özet
oz FONKSİYON YAKLAŞIMI KULLANARAK ÇOKLU-ETMEN TAKVİYE ÖĞRENME Abul, Osman Yüksek Lisans, Bilgisayar Mühendisliği Bölümü Tez Yöneticisi: Doç. Dr. Faruk Polat Ağustos 1999, 67 sayfa Düşmanca unsurların bulunduğu bir ortamda öğrenme ve çevreye uyum önem kazanmaktadır. Eğer etmenler yaşadıkları çevrenin dinamikleri hakkında çok az bilgiye sahipseler takviye öğrenme tekniklerini kullanabilirler. Bu tezde düşmanca bir ortam olan AFCW'de takviye öğrenme teknikleri üzerinde çalışılmıştır. AFCW'de yaşayan etmenler yaşamak için öğrenmek zorundadır. Bunun yanında çoklu-etmen AFCW'de etmenler yaşamayı daha kolay hale getirmek için koordinasyona ihtiyaç duyarlar. Etmenler arasında açık iletişim gerektirmeyen iki tane koordinasyon yöntemi sunulmuştur. AFCW, çok büyük durum uzayına sahiptir, dolayısıyla öğrenilen bilginin saklandığı geleneksel bakma tabloları yetersiz kalmaktadır. Büyük ölçüler için fonksiyon yaklaşımı ve genelleme metodları kullanılmıştır. Çok sayıda fonksiyon yaklaşımı mimarisi ve takviye öğrenme algoritması ile deney yapılmıştır. Hem tek-etmen hem de çoklu-etmen AFCW için deney sonuçları sunulmuştur.
Özet (Çeviri)
ABSTRACT MULTI-AGENT REINFORCEMENT LEARNING USING FUNCTION APPROXIMATION Abul, Osman M.S., Department of Computer Engineering Supervisor: Assoc. Prof. Dr. Faruk Polat August 1999, 67 pages Learning and adaptation become more important for agents living in hostile environments. Agents can use reinforcement learning techniques if they have little information about dynamics of their environment. In this thesis, we have studied reinforcement learning techniques in a dynamic hostile environment (AFCW). The agents in AFCW need to learn to survive. Besides, the agents in multi-agent AFCW need to cooperate for making the task easier. Two cooperation methods that don't require explicit communication among agents are presented. The AFCW domain has huge state space, so traditional lookup tables are insufficient to store acquired knowledge. Function approximation and generalization methods are used for scaling up. We have experimented with various function approximation architectures and reinforcement learning algorithms. The experimental results for both single-agent and multi-agent AFCW environments are presented.
Benzer Tezler
- Reinforcement learning of multi-agent team behavior
Çoklu-etmen takım davranışlarının pekiştirmeli öğrenilmesi
MEHMET UTKU TATLIDEDE
Yüksek Lisans
İngilizce
2003
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. LEVENT AKIN
- A heterogeneous multi agent intelligent player for a real-time strategy game
Gerçek zamanlı strateji oyunu için heterojen çoklu etmenler kullanan akıllı oyuncu
MEHMET CİHAN KURT
Yüksek Lisans
İngilizce
2010
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolMarmara ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. MUSTAFA BORAHAN TÜMER
- Çizge ve içerik verilerinde kolektif sınıflandırma algoritmalarının karşılaştırılması
A comparison of collective classification techniques on network and content data
ÖZGE ATASEVEN
Yüksek Lisans
Türkçe
2017
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. YUSUF YASLAN
- Etmenlerin iç modelini kullanarak çoklu etmenlerde bulanık takviyeli öğrenme
Fuzzy reinforcement learning in multi-agent systems using internal model of agents
ALPER KILIÇ
Yüksek Lisans
Türkçe
2002
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolFırat ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ.DR. AHMET ARSLAN
- IQ-flow: Mechanism design for inducing cooperative behavior to self-interested agents in sequential social dilemmas
TQ-akışı: Ardışıl sosyal ikilemlerdeki çıkarcı etmenleri işbirlikçi davranışa teşvik etmek için mekanizma tasarımı
BENGİSU GÜRESTİ
Yüksek Lisans
İngilizce
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. NAZIM KEMAL ÜRE