Geri Dön

2 LRL: A two-level multi-agent reinforcement learning algorithm with communication

2 LRL: Bir iki seviyeli iletişimli çoklu-etmen takviye öğrenme metodu

  1. Tez No: 119496
  2. Yazar: GÜRAY ERUS
  3. Danışmanlar: PROF.DR. FARUK POLAT
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Çoklu-etmen Öğrenme, Takviye-Öğrenme, Edimsel Koşullama, Çoklu-etmen İşbirliği, İletişim iv, Multi-agent Learning, Reinforcement Learning, Multi-agent Cooperation, Communication 111 *
  7. Yıl: 2002
  8. Dil: İngilizce
  9. Üniversite: Orta Doğu Teknik Üniversitesi
  10. Enstitü: Enformatik Enstitüsü
  11. Ana Bilim Dalı: Bilişim Sistemleri Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 59

Özet

oz 2LRL: BİR İKİ SEVİYELİ ÎLETİŞİMLÎ ÇOKLU-ETMEN TAKVÎYE- ÖĞRENME METODU Erus, Güray Yüksek Lisans, Bilişsel Bilimler Anabilim Dalı Tez Yöneticisi: Prof. Faruk Polat Ortak Tez Yöneticisi: Yrd. Prof. Bilge Say Eylül 2002, 59 sayfa Öğrenme“akıllı”bir hesaplamasal sistemin bir anahtar bileşenidir. Çoklu-Etmen Sistemlerinde öğrenme ortak hedefleri sağlama amacıyla işbirlikçi bir davranışın edinimini içerir. Takviye-Öğrenme (TÖ) erken dönem hayvanlarda öğrenme çalışmalarından esinlenmiş gelecek vaadeden bir denetlemesiz makina-öğrenme metodudur. Bu tezde bir çoklu-etmen ortamda işbirlikçi hareket seçimini sağlayan yeni bir çoklu-etmen öğrenme tekniğini, İki Seviyeli İletişimli Çoklu- Etmen Öğrenme (2LRL) algoritmasını sunuyoruz. 2LRL'de etmenin karar mekanizması, ilk seviyede hedefini seçmeyi ve ikinci seviyede bu hedefe yönelik hareketi seçmeyi öğrenecek şekilde hiyerarşik iki seviyeye bölünmüştür. Etmenler algılarını komşularına iletirler ve karar vermede iletişim bilgisini kullanırlar. 2LRL algoritmasını bir avcı-av alanında uyguladık ve tatmin edici bir işbirlikçi davranış gözlemledik.

Özet (Çeviri)

ABSTRACT 2LRL: A TWO-LEVEL MULTI-AGENT REINFORCEMENT LEARNING METHOD WITH COMMUNICATION Erus, Güray M.S., Cognitive Sciences Program Supervisor: Prof. Faruk Polat Co-Supervisor: Assist. Prof. Bilge Say September 2002, 59 pages Learning is a key element of an“intelligent”computational system. In Multi- agent Systems (MASs), learning involves acquisition of a cooperative behavior in order to satisfy the joint goals. Reinforcement Learning (RL) is a promising unsupervised machine learning technique inspired from the earlier studies in animal learning. In this thesis, we propose the Two Level Reinforcement Learning with Communication (2LRL) method, a new RL technique to provide cooperative action selection in a multi-agent environment. In 2LRL, the decision mechanism of the agents is divided into two hierarchical levels, in which the agents learn to select their target in the first level and to select the action directed to their target in the second level. The agents communicate their perception to their neighbors and use the communication information in their decision-making. We applied 2LRL method in a hunter-prey environment and observed a satisfactory cooperative behavior.

Benzer Tezler

  1. Skafolunat instabilite tedavisinde farklı tenodez yöntemlerinin karşılaştırılması: Kadavra çalışması

    Comparison of different tenodesis methods in scapholunate instability treatment: A study of kadavra

    CAN YENER

    Tıpta Uzmanlık

    Türkçe

    Türkçe

    2021

    Ortopedi ve TravmatolojiEge Üniversitesi

    Ortopedi ve Travmatoloji Ana Bilim Dalı

    PROF. DR. NADİR ÖZKAYIN

  2. 1,3-difenil-4,5-bis(hidroksiimino)-imidazolidin ve Ni(II), Cu(II), Pd(II), UO2(VI) komplekslerinin sentezi

    Başlık çevirisi yok

    VEFA AHSEN

    Doktora

    Türkçe

    Türkçe

    1984

    Kimya MühendisliğiUludağ Üniversitesi

    Kimya Mühendisliği Ana Bilim Dalı

    PROF. DR. ÖZER BEKAROĞLU

  3. 1,10-fenantrolin ve etilendiamin içeren karışık ligantlı bazı geçiş metal-süksinato komplekslerinin sentezi, spektroskopik, termik ve yapısal özelliklerinin incelenmesi

    Synthesis, spectroscopic examination and thermal behaviour of some mixed ligand metal-succinato complexes with 1,10-phenanthroline and ethylendiamine

    SELÇUK DEMİR

    Yüksek Lisans

    Türkçe

    Türkçe

    2001

    KimyaOndokuz Mayıs Üniversitesi

    Kimya Ana Bilim Dalı

    PROF.DR. VEYSEL TURAN YILMAZ

  4. a-dazo-B-oksoaldehitlerde triazol türevlerinin sentezi

    Başlık çevirisi yok

    KADİR DABAK

    Yüksek Lisans

    Türkçe

    Türkçe

    1996

    Kimyaİstanbul Teknik Üniversitesi

    PROF.DR. AHMET AKAR

  5. Silindirik elyaf ve tanecik katkılı karma malzemelerin efektif ısı iletim katsayısı

    Effective thermal conductivity of composite materials with cylindrical fiber and particulate inclusions

    MEHMET SAİT SAFFET BAYSAL

    Doktora

    Türkçe

    Türkçe

    2001

    Uçak Mühendisliğiİstanbul Teknik Üniversitesi

    PROF. DR. AKSEL ÖZTÜRK