2 LRL: A two-level multi-agent reinforcement learning algorithm with communication
2 LRL: Bir iki seviyeli iletişimli çoklu-etmen takviye öğrenme metodu
- Tez No: 119496
- Danışmanlar: PROF.DR. FARUK POLAT
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Çoklu-etmen Öğrenme, Takviye-Öğrenme, Edimsel Koşullama, Çoklu-etmen İşbirliği, İletişim iv, Multi-agent Learning, Reinforcement Learning, Multi-agent Cooperation, Communication 111 *
- Yıl: 2002
- Dil: İngilizce
- Üniversite: Orta Doğu Teknik Üniversitesi
- Enstitü: Enformatik Enstitüsü
- Ana Bilim Dalı: Bilişim Sistemleri Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 59
Özet
oz 2LRL: BİR İKİ SEVİYELİ ÎLETİŞİMLÎ ÇOKLU-ETMEN TAKVÎYE- ÖĞRENME METODU Erus, Güray Yüksek Lisans, Bilişsel Bilimler Anabilim Dalı Tez Yöneticisi: Prof. Faruk Polat Ortak Tez Yöneticisi: Yrd. Prof. Bilge Say Eylül 2002, 59 sayfa Öğrenme“akıllı”bir hesaplamasal sistemin bir anahtar bileşenidir. Çoklu-Etmen Sistemlerinde öğrenme ortak hedefleri sağlama amacıyla işbirlikçi bir davranışın edinimini içerir. Takviye-Öğrenme (TÖ) erken dönem hayvanlarda öğrenme çalışmalarından esinlenmiş gelecek vaadeden bir denetlemesiz makina-öğrenme metodudur. Bu tezde bir çoklu-etmen ortamda işbirlikçi hareket seçimini sağlayan yeni bir çoklu-etmen öğrenme tekniğini, İki Seviyeli İletişimli Çoklu- Etmen Öğrenme (2LRL) algoritmasını sunuyoruz. 2LRL'de etmenin karar mekanizması, ilk seviyede hedefini seçmeyi ve ikinci seviyede bu hedefe yönelik hareketi seçmeyi öğrenecek şekilde hiyerarşik iki seviyeye bölünmüştür. Etmenler algılarını komşularına iletirler ve karar vermede iletişim bilgisini kullanırlar. 2LRL algoritmasını bir avcı-av alanında uyguladık ve tatmin edici bir işbirlikçi davranış gözlemledik.
Özet (Çeviri)
ABSTRACT 2LRL: A TWO-LEVEL MULTI-AGENT REINFORCEMENT LEARNING METHOD WITH COMMUNICATION Erus, Güray M.S., Cognitive Sciences Program Supervisor: Prof. Faruk Polat Co-Supervisor: Assist. Prof. Bilge Say September 2002, 59 pages Learning is a key element of an“intelligent”computational system. In Multi- agent Systems (MASs), learning involves acquisition of a cooperative behavior in order to satisfy the joint goals. Reinforcement Learning (RL) is a promising unsupervised machine learning technique inspired from the earlier studies in animal learning. In this thesis, we propose the Two Level Reinforcement Learning with Communication (2LRL) method, a new RL technique to provide cooperative action selection in a multi-agent environment. In 2LRL, the decision mechanism of the agents is divided into two hierarchical levels, in which the agents learn to select their target in the first level and to select the action directed to their target in the second level. The agents communicate their perception to their neighbors and use the communication information in their decision-making. We applied 2LRL method in a hunter-prey environment and observed a satisfactory cooperative behavior.
Benzer Tezler
- Skafolunat instabilite tedavisinde farklı tenodez yöntemlerinin karşılaştırılması: Kadavra çalışması
Comparison of different tenodesis methods in scapholunate instability treatment: A study of kadavra
CAN YENER
Tıpta Uzmanlık
Türkçe
2021
Ortopedi ve TravmatolojiEge ÜniversitesiOrtopedi ve Travmatoloji Ana Bilim Dalı
PROF. DR. NADİR ÖZKAYIN
- 1,3-difenil-4,5-bis(hidroksiimino)-imidazolidin ve Ni(II), Cu(II), Pd(II), UO2(VI) komplekslerinin sentezi
Başlık çevirisi yok
VEFA AHSEN
Doktora
Türkçe
1984
Kimya MühendisliğiUludağ ÜniversitesiKimya Mühendisliği Ana Bilim Dalı
PROF. DR. ÖZER BEKAROĞLU
- 1,10-fenantrolin ve etilendiamin içeren karışık ligantlı bazı geçiş metal-süksinato komplekslerinin sentezi, spektroskopik, termik ve yapısal özelliklerinin incelenmesi
Synthesis, spectroscopic examination and thermal behaviour of some mixed ligand metal-succinato complexes with 1,10-phenanthroline and ethylendiamine
SELÇUK DEMİR
Yüksek Lisans
Türkçe
2001
KimyaOndokuz Mayıs ÜniversitesiKimya Ana Bilim Dalı
PROF.DR. VEYSEL TURAN YILMAZ
- Silindirik elyaf ve tanecik katkılı karma malzemelerin efektif ısı iletim katsayısı
Effective thermal conductivity of composite materials with cylindrical fiber and particulate inclusions
MEHMET SAİT SAFFET BAYSAL