S-learning: A multi-agent reinforcement learning method

S-öğrenme: Bir çoklu-etmen takviye-öğrenme metodu

Tez No: 93370
Yazar: UĞUR KUTER
Danışmanlar: DOÇ. DR. FARUK POLAT
Tez Türü: Yüksek Lisans
Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
Anahtar Kelimeler: çoklu-etmen öğrenme, çoklu-etmen koordinasyonu, takviye öğrenme iv f77.İl, multi-agent learning, multi-agent cooperation, reinforcement learning m
Yıl: 2000
Dil: İngilizce
Üniversite: Orta Doğu Teknik Üniversitesi
Enstitü: Fen Bilimleri Enstitüsü
Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
Bilim Dalı: Belirtilmemiş.
Sayfa Sayısı: 57

Özet

oz S-OGRENME: BİR ÇOKLU-ETMEN TAKVIYE-OGRENME METODU Kuter, Uğur Yüksek Lisans, Bilgisayar Mühendisliği Bölümü Tez Yöneticisi: Doç. Dr. Faruk Polat Haziran 2000, 48 sayfa Çoklu-Etmen Sistemlerinde öğrenme günümüzde önem verilen bir araştırma konusudur. Çoklu-Etmen sistemleri içerdikleri hareketli varlıklar sayesinde dinamik ve belirsiz bir yapıya sahiptir. Bu tip sistemlerde, diğer makina-öğrenme metodları arasından Takviye- Öğrenme (TO) en çok gelecek vaadeden yöntemdir. Bunun nedeni, TO 'nün varlıkların içinde bulundukları dünya ile iletişimleri üzerine kurulmuş olmasıdır. Bu yüzden takviye- öğrenme, Çoklu-Etmen sistemlerinde etkili öğrenme potansiyeline sahip olan mekaniz malar önermektedir. Fakat bugüne kadar geliştirilmiş olan TO tabanlı algoritmalar dinamik ve belirsiz ortamların getirdiği problemlere çözüm önerememişlerdir. Bunun nedeni bu algoritmaların üzerinde çalıştıkları ortam hakkında sabit ve daha önceden be lirlenmiş bilgi modellere gereksinim duymalarıdır. Bu tezde, yeni bir takviye-öğrenme tabanlı algoritma önerilmektedir. Bu algoritma özel olarak Çoklu-Etmen sistemleri için geliştirilmiş olup, değişime açık bilgi üzerinden öğrenmektedir. Dinamik ve belirsiz bir ortamda düzenlenen deneylerde, bu algoritmanın bilinen diğer takviye-öğrenme tabanlı metodlara oranla daha tatmin edici sonuçlar verdiği gözlenmiştir.

Özet (Çeviri)

ABSTRACT S-LEARNING: A MULTI-AGENT REINFORCEMENT LEARNING METHOD Kuter, Ugur M.S., Department of Computer Engineering Supervisor: Assoc. Prof. Dr. Faruk Polat June 2000, 48 pages Learning in Multi-Agent Systems (MASs) is a hot research problem today. MASs involve many non-stationary entities, which give the systems a dynamic and non- deterministic nature. In such systems, Reinforcement Learning (RL) is the most promising paradigm among the other machine learning methods. This is because RL is based on the interactions of the entities with the environment in which they are oper ating. Due to this fact, RL has the potential to provide effective learning mechanisms for the MASs. However, currently developed RL-based algorithms cannot cope with the dynamic and non-deterministic environments since their learning mechanisms are based on the pre-defined models and static knowledge models about the environment. In this thesis, a new RL-based algorithm, called S-Learning, is presented. This algo rithm is designed for MASs and does perform learning on data that is open-to-change. It is shown in the experiments that S-Learning gives very satisfactory results in a dy namic and non-deterministic simulated environment compared to the other RL-based algorithms.

Benzer Tezler

Tez No
119496
2 LRL: A two-level multi-agent reinforcement learning algorithm with communication
2 LRL: Bir iki seviyeli iletişimli çoklu-etmen takviye öğrenme metodu
GÜRAY ERUS
Yüksek Lisans
İngilizce
2002
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol Orta Doğu Teknik Üniversitesi
Bilişim Sistemleri Ana Bilim Dalı
PROF.DR. FARUK POLAT
Tez No
803654
Deep reinforcement learning approach in control of Stewart platform- simulation and control
Stewart platformunun kontrolünde derin pekistirmeli öğrenme yaklaşımıc- simülasyon ve kontrol
HADI YADAVARI
Doktora
İngilizce
2023
Mekatronik Mühendisliği İstanbul Teknik Üniversitesi
Mekatronik Mühendisliği Ana Bilim Dalı
DOÇ. DR. SERHAT İKİZOĞLU
DR. ÖĞR. ÜYESİ VAHİT BARIŞ TAVAKOL
Tez No
773984
Analysis of meta-gradient incentive algorithm for cooperative behavior in social dilemma problems
Sosyal ikilem problemlerinde işbirlikçi davranış için meta-gradient teşvik algoritması analizi
ABDULLAH VANLIOĞLU
Yüksek Lisans
İngilizce
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol İstanbul Teknik Üniversitesi
Savunma Teknolojileri Ana Bilim Dalı
DOÇ. DR. NAZIM KEMAL ÜRE
Tez No
947596
AI-enhanced dynamic preemptive resource allocation in next generation cellular networks
Yeni nesil hücresel ağlarda yapay zeka destekli dinamik öncelikli kaynak tahsisi
EGE ENGİN
Doktora
İngilizce
2025
Elektrik ve Elektronik Mühendisliği İstanbul Teknik Üniversitesi
Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
PROF. DR. HAKAN ALİ ÇIRPAN
Tez No
520901
Reinforcement learning control for autorotation of a simple point-mass helicopter model
Basitleştirilmiş bir nokta-kütle helikopter modeli otorotasyonu için takviyeli öğrenme kontrolü
KADİRCAN KOPŞA
Yüksek Lisans
İngilizce
2018
Havacılık Mühendisliği Orta Doğu Teknik Üniversitesi
Havacılık ve Uzay Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ALİ TÜRKER KUTAY

Geri Dön