Modüler bulanık takviyeli öğrenme
Modular fuzzy reinforcement learning
- Tez No: 119525
- Danışmanlar: DOÇ. DR. AHMET ARSLAN
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Yapay zekâ, takviyeli öğrenme, Q öğrenme, modüler mimari, markov karar verme süreci, dahili modelin tahmini, bulanık mantık, modüler bulanık-takviyeli öğrenme. VIII, Artificial intelligence, Reinforcement learning, Q - learning, Modular architecture, Markov decision process, Estimation of internal model, Fuzzy logic, Modular - fuzzy reinforcement learning. IX
- Yıl: 2002
- Dil: Türkçe
- Üniversite: Fırat Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 56
Özet
ÖZET Yüksek Lisans Tezi MODÜLER BULANIK TAKVİYELİ ÖĞRENME İrfan GÜLTEKİN Fırat Üniversitesi Fen Bilimleri Enstitüsü Bilgisayar Mühendisliği Anabilim Dalı 2002, Sayfa: 46 Çoklu etmenli sistemlerdeki takviyeli öğrenme uygulamaları son zamanlarda oldukça ilgi çekmiştir. Çoklu etmenli sistemlerde, durum uzayının fazla olması etmenlerin öğrenmesinde büyük problem teşkil eder. Aynı ortamdaki etmenlerin birlikte hareket etmesi için, çoklu etmenli sistemlerdeki etmenlerin birbirlerinin hareketlerini değerlendirmesi ve gözlemlemesi gerekir. Bu durumda durum uzayının boyutu etmen sayısıyla eksporansiyel olarak artar. Bu tezde bu problemin çözümü için yeni bir yöntem sunulacaktır. Bu yöntemde çoklu etmenli sistemlerde, modüler mimari, dahili modelin tahmini ve bulanık mantığın avantajları birlikte kullanılmıştır. Geliştirilen koordinasyon yöntemi bir etmenin, diğer etmenlerin dahili modellerine göre hareketlerinin tahminine dayanır. Dahili model diğer etmenlerin hareketlerinin gözlemlenmesi ve değerlendirilmesi ile oluşturulur. Bulanık mantık, her öğrenme modülünün durum uzayından oluşturulan bulanık giriş kümelerinden ve hareket uzayından oluşturulan bulanık çıkış kümelerinden oluşturulur. Her öğrenme modülünün bulanık kural tabanı Q - öğrenme doğrultusunda yapılandırılır. Deneysel sonuçlar, durum uzayında gerçekleştirilen uygulamanın geçerliliğini göstermek için sunulmuştur.
Özet (Çeviri)
ABSTRACT Masters Thesis MODULAR - FUZZY REINFORCEMENT LEARNING İrfan GÜLTEKİN Fırat University Graduate School of Natural and Applied Sciences Department of Computer Engineering 2002, Page: 46 The application of reinforcement learning to multi-agent systems has attracted recent attention. In multi-agent systems, the state space to be handled constitutes a major problem efficiently in learning of agents. In order to cooperate agents in the same environment, it is needed to observe and evaluate the action of other agents in the multi-agent system. This case increases the dimension of state space proportional to the number of agents, exponentially. This theses presents a novel approach to overcome this problem. The approach uses together the advantages of the modular architecture, estimation of internal model and fuzzy logic in multi-agent systems. In our cooperation method, one agent estimates its action according to the internal model of the other agent. The internal model is acquired by the observation and evaluation of the other agent's actions. Fuzzy logic maps from input fuzzy sets, representing state space of each learning module to the output fuzzy sets representing the action space. The fuzzy rule base of each learning module is built through the Q-learning. Experimental results handled on pursuit domain show the effectiveness and applicability of the proposed approach.
Benzer Tezler
- Çoklu eleman takviyeli öğrenmeye veri madenciliği tabanlı yeni yaklaşımlar
Data mining based novel approaches to multiagent reinforcement learning
MEHMET KAYA
Doktora
Türkçe
2003
Elektrik ve Elektronik MühendisliğiFırat ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
DOÇ. DR. AHMET ARSLAN
- Yapay sinir ağlarında öğrenme algoritmalarının analizi
Analysis of learning algorithms in neural networks
SEVİNÇ BAKLAVACI
Yüksek Lisans
Türkçe
1994
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiDOÇ.DR. LEYLA GÖREN
- The role of oxidative stress factors in the pathophysiology of Ocular Rosacea, analysis of tears and other materials
Oküler Rosacea patofizyolojisinde oksidatif stres faktörlerinin rolü, gözyaşı ve diğer materyallerin analizi
NİLÜFER YEŞİLIRMAK
Doktora
İngilizce
2023
BiyokimyaGazi ÜniversitesiTıbbi Biyokimya Ana Bilim Dalı
PROF. DR. NESLİHAN BUKAN
PROF. DR. JEAN-LOUIS BOURGES
- Washing machine product family design with modular product design approach
Modüler ürün tasarımı yaklaşımıyla çamaşır makinesi ürün ailesi tasarımı
TUBA DOLAR
Yüksek Lisans
İngilizce
2021
Makine Mühendisliğiİstanbul Teknik ÜniversitesiMakine Mühendisliği Ana Bilim Dalı
PROF. DR. ATA MUGAN
- Otonom simetrik mobil robotun bulanık mantık ve derin öğrenme tabanlı konum kontrolünün gerçekleştirilmesi
Realization of fuzzy logic and deep learning based position control of autonomous symmetric mobile robot
AHMET TOP
Doktora
Türkçe
2023
Elektrik ve Elektronik MühendisliğiFırat ÜniversitesiElektrik-Elektronik Mühendisliği Teknolojileri Ana Bilim Dalı
PROF. DR. MUAMMER GÖKBULUT