2 LRL: A two-level multi-agent reinforcement learning algorithm with communication

2 LRL: Bir iki seviyeli iletişimli çoklu-etmen takviye öğrenme metodu

Tez No: 119496
Yazar: GÜRAY ERUS
Danışmanlar: PROF.DR. FARUK POLAT
Tez Türü: Yüksek Lisans
Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
Anahtar Kelimeler: Çoklu-etmen Öğrenme, Takviye-Öğrenme, Edimsel Koşullama, Çoklu-etmen İşbirliği, İletişim iv, Multi-agent Learning, Reinforcement Learning, Multi-agent Cooperation, Communication 111 *
Yıl: 2002
Dil: İngilizce
Üniversite: Orta Doğu Teknik Üniversitesi
Enstitü: Enformatik Enstitüsü
Ana Bilim Dalı: Bilişim Sistemleri Ana Bilim Dalı
Bilim Dalı: Belirtilmemiş.
Sayfa Sayısı: 59

Özet

oz 2LRL: BİR İKİ SEVİYELİ ÎLETİŞİMLÎ ÇOKLU-ETMEN TAKVÎYE- ÖĞRENME METODU Erus, Güray Yüksek Lisans, Bilişsel Bilimler Anabilim Dalı Tez Yöneticisi: Prof. Faruk Polat Ortak Tez Yöneticisi: Yrd. Prof. Bilge Say Eylül 2002, 59 sayfa Öğrenme“akıllı”bir hesaplamasal sistemin bir anahtar bileşenidir. Çoklu-Etmen Sistemlerinde öğrenme ortak hedefleri sağlama amacıyla işbirlikçi bir davranışın edinimini içerir. Takviye-Öğrenme (TÖ) erken dönem hayvanlarda öğrenme çalışmalarından esinlenmiş gelecek vaadeden bir denetlemesiz makina-öğrenme metodudur. Bu tezde bir çoklu-etmen ortamda işbirlikçi hareket seçimini sağlayan yeni bir çoklu-etmen öğrenme tekniğini, İki Seviyeli İletişimli Çoklu- Etmen Öğrenme (2LRL) algoritmasını sunuyoruz. 2LRL'de etmenin karar mekanizması, ilk seviyede hedefini seçmeyi ve ikinci seviyede bu hedefe yönelik hareketi seçmeyi öğrenecek şekilde hiyerarşik iki seviyeye bölünmüştür. Etmenler algılarını komşularına iletirler ve karar vermede iletişim bilgisini kullanırlar. 2LRL algoritmasını bir avcı-av alanında uyguladık ve tatmin edici bir işbirlikçi davranış gözlemledik.

Özet (Çeviri)

ABSTRACT 2LRL: A TWO-LEVEL MULTI-AGENT REINFORCEMENT LEARNING METHOD WITH COMMUNICATION Erus, Güray M.S., Cognitive Sciences Program Supervisor: Prof. Faruk Polat Co-Supervisor: Assist. Prof. Bilge Say September 2002, 59 pages Learning is a key element of an“intelligent”computational system. In Multi- agent Systems (MASs), learning involves acquisition of a cooperative behavior in order to satisfy the joint goals. Reinforcement Learning (RL) is a promising unsupervised machine learning technique inspired from the earlier studies in animal learning. In this thesis, we propose the Two Level Reinforcement Learning with Communication (2LRL) method, a new RL technique to provide cooperative action selection in a multi-agent environment. In 2LRL, the decision mechanism of the agents is divided into two hierarchical levels, in which the agents learn to select their target in the first level and to select the action directed to their target in the second level. The agents communicate their perception to their neighbors and use the communication information in their decision-making. We applied 2LRL method in a hunter-prey environment and observed a satisfactory cooperative behavior.

Benzer Tezler

Tez No
926978
Investigating ici-induced thyroid dysfunction: Initial immune dysregulation insights and 3d co-culture model with Nthy-Ori 3-1 and PBMC
İmmün kontrol-noktası inhibitör tedavisi kaynaklı immün disfonksiyonların araştırılması: Bağışıklık düzenleme bozukluklarına dair ilk bulgular ve Nthy-Ori 3-1 ile PBMC'lerin ortak kültürü
ADELIYA TEMIRBEK
Yüksek Lisans
İngilizce
2024
Allerji ve İmmünoloji Koç Üniversitesi
İmmünoloji Ana Bilim Dalı
DOÇ. DR. YILDIZ TÜTÜNCÜ
Tez No
677800
Skafolunat instabilite tedavisinde farklı tenodez yöntemlerinin karşılaştırılması: Kadavra çalışması
Comparison of different tenodesis methods in scapholunate instability treatment: A study of kadavra
CAN YENER
Tıpta Uzmanlık
Türkçe
2021
Ortopedi ve Travmatoloji Ege Üniversitesi
Ortopedi ve Travmatoloji Ana Bilim Dalı
PROF. DR. NADİR ÖZKAYIN
Tez No
228
1,3-difenil-4,5-bis(hidroksiimino)-imidazolidin ve Ni(II), Cu(II), Pd(II), UO2(VI) komplekslerinin sentezi
Başlık çevirisi yok
VEFA AHSEN
Doktora
Türkçe
1984
Kimya Mühendisliği Uludağ Üniversitesi
Kimya Mühendisliği Ana Bilim Dalı
PROF. DR. ÖZER BEKAROĞLU
Tez No
105758
1,10-fenantrolin ve etilendiamin içeren karışık ligantlı bazı geçiş metal-süksinato komplekslerinin sentezi, spektroskopik, termik ve yapısal özelliklerinin incelenmesi
Synthesis, spectroscopic examination and thermal behaviour of some mixed ligand metal-succinato complexes with 1,10-phenanthroline and ethylendiamine
SELÇUK DEMİR
Yüksek Lisans
Türkçe
2001
Kimya Ondokuz Mayıs Üniversitesi
Kimya Ana Bilim Dalı
PROF.DR. VEYSEL TURAN YILMAZ
Tez No
55773
a-dazo-B-oksoaldehitlerde triazol türevlerinin sentezi
Başlık çevirisi yok
KADİR DABAK
Yüksek Lisans
Türkçe
1996
Kimya İstanbul Teknik Üniversitesi
PROF.DR. AHMET AKAR

Geri Dön