Etmenlerin iç modelini kullanarak çoklu etmenlerde bulanık takviyeli öğrenme
Fuzzy reinforcement learning in multi-agent systems using internal model of agents
- Tez No: 119526
- Danışmanlar: DOÇ.DR. AHMET ARSLAN
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Çoklu etmenli sistemler, Makine öğrenmesi, Takviye öğrenme, Q-Öğrenme, Bulanık Mantık, Multi-Agent Systems, Machine Learning, Reinforcement Learning, Q- Learning, Fuzzy Logic. VI
- Yıl: 2002
- Dil: Türkçe
- Üniversite: Fırat Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 58
Özet
Yüksek Lisans Tezi etmenlerin iç modelini kullanarak çoklu etmenlerde bulanık takviyeli öğrenme Alper KILIÇ Fırat Üniversitesi Fen Bilimleri Enstitüsü Bilgisayar Mühendisliği Anabilim Dalı 2002, Sayfa :49 Çoklu etmenli sistemlerde birlikte hareket etme ve işbirliği davranışlarının öğrenilmesi işleminin gerçekleştirilmesi Yapay Zeka sistemleri için son yıllarda gelişen yeni bir bakış açısı ortaya koymuştur. Özellikle Takviye Öğrenme yöntemleri çoklu etmenli sistemlere ve dinamik ortamlara uygulanabilirliğinden dolayı bir çok çalışmanın odak noktası haline gelmiştir. Takviye öğrenme metotları içerisinde en popüler algoritmalardan olan Q-öğrenme; çoklu etmenli sistemlere uygulandığı durumlarda optimum politikaya yönelme hızı bakımından ve sürekli- tam olarak gözlemlenemeyen ortamlarda ek bazı dezavantajları da beraberinde getirmektedir. Bu tez çalışmasında çoklu etmenli sistemlerde konu olan dezavantajların giderilmesi amacıyla hem standart Q-öğrenme algoritmasına alternatif bir algoritma sunulmuş (FQ-Öğrenme), hem de diğer etmenlerin iç modelinin çıkarılması için bulanık küme ve bulanık mantık yaklaşımı üzerinde durularak sonuçlar performans bakımından incelenmiştir.
Özet (Çeviri)
Masters Thesis FUZZY REINFORCEMENT LEARNING IN MULTI-AGENT SYSTEMS USING INTERNAL MODEL OF AGENTS Alper KILIÇ Fırat University Graduate School ofNatural and Applied Sciences Department of Computer Engineering 2002 : Page 50 Recently, delayed reinforcement learning (RL) has been proposed as a strong method for learning in multi-agent systems (MASs). In this method, agents are concerned with the problem of discovering an optimal policy, a function mapping states to actions. The most popular RL technique, Q-learning, has been proven to produce an optimal policy under certain conditions. In this thesis, we consider a multi-agent cooperation problem, and propose a multi-agent reinforcement learning method based on the other agents' actions. In our learning method, the agent under consideration observes other agents' action, and uses the minimax Q-learning using fuzzy state and fuzzy goal representation for updating fuzzy Q values. We also proposed a new method called FQ-learning so as to accelerate convergence of learning process.
Benzer Tezler
- Sanal firmalara yönelik etmen ve rol tabanlı web servis pazarı
A role and agent based web service market for virtual companies
ALİ DURMUŞ
Doktora
Türkçe
2011
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. NADİA ERDOĞAN
- A methodology for energy optimization of buildings considering simultaneously building envelope HVAC and renewable system parameters
Binalarda yapı kabuğu, mekanik sistemler ve yenilenebilir enerji sistemleri parametrelerinin eş zamanlı enerji optimizasyonu için bir yöntem
MELTEM BAYRAKTAR
Doktora
İngilizce
2015
Enerjiİstanbul Teknik ÜniversitesiMimarlık Ana Bilim Dalı
PROF. DR. AYŞE ZERRİN YILMAZ
PROF. DR. MARCO PERINO
- Distributed team formation for robot soccer
Robot futbolu için dağıtılmış takım formasyonu
ONURALP ULUSOY
Yüksek Lisans
İngilizce
2012
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. SANEM SARIEL-TALAY
- Intelligent agents based simulation using Jack development environment
Jack geliştirme ortamında kullanarak akıllı etmenler tabanlı benzetim
ÇAĞATAY ÇATAL
Yüksek Lisans
İngilizce
2004
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ.DR. COŞKUN SÖNMEZ
- Bilişim alanında proje esaslı çalışan firmalarda ürün geliştirme süreçlerindeki bozucu etmenlerin modellenmesi ve etkilerinin belirlenmesi
Modeling destructive factors in product development process of project based companies in the field of information technologies and determining their impacts
NERMİN SÖKMEN
Doktora
Türkçe
2011
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesiİşletme Mühendisliği Ana Bilim Dalı
DOÇ. DR. FERHAN ÇEBİ
PROF. DR. SITKI GÖZLÜ