Geri Dön

Modüler bulanık takviyeli öğrenme

Modular fuzzy reinforcement learning

  1. Tez No: 119525
  2. Yazar: İRFAN GÜLTEKİN
  3. Danışmanlar: DOÇ. DR. AHMET ARSLAN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Yapay zekâ, takviyeli öğrenme, Q öğrenme, modüler mimari, markov karar verme süreci, dahili modelin tahmini, bulanık mantık, modüler bulanık-takviyeli öğrenme. VIII, Artificial intelligence, Reinforcement learning, Q - learning, Modular architecture, Markov decision process, Estimation of internal model, Fuzzy logic, Modular - fuzzy reinforcement learning. IX
  7. Yıl: 2002
  8. Dil: Türkçe
  9. Üniversite: Fırat Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 56

Özet

ÖZET Yüksek Lisans Tezi MODÜLER BULANIK TAKVİYELİ ÖĞRENME İrfan GÜLTEKİN Fırat Üniversitesi Fen Bilimleri Enstitüsü Bilgisayar Mühendisliği Anabilim Dalı 2002, Sayfa: 46 Çoklu etmenli sistemlerdeki takviyeli öğrenme uygulamaları son zamanlarda oldukça ilgi çekmiştir. Çoklu etmenli sistemlerde, durum uzayının fazla olması etmenlerin öğrenmesinde büyük problem teşkil eder. Aynı ortamdaki etmenlerin birlikte hareket etmesi için, çoklu etmenli sistemlerdeki etmenlerin birbirlerinin hareketlerini değerlendirmesi ve gözlemlemesi gerekir. Bu durumda durum uzayının boyutu etmen sayısıyla eksporansiyel olarak artar. Bu tezde bu problemin çözümü için yeni bir yöntem sunulacaktır. Bu yöntemde çoklu etmenli sistemlerde, modüler mimari, dahili modelin tahmini ve bulanık mantığın avantajları birlikte kullanılmıştır. Geliştirilen koordinasyon yöntemi bir etmenin, diğer etmenlerin dahili modellerine göre hareketlerinin tahminine dayanır. Dahili model diğer etmenlerin hareketlerinin gözlemlenmesi ve değerlendirilmesi ile oluşturulur. Bulanık mantık, her öğrenme modülünün durum uzayından oluşturulan bulanık giriş kümelerinden ve hareket uzayından oluşturulan bulanık çıkış kümelerinden oluşturulur. Her öğrenme modülünün bulanık kural tabanı Q - öğrenme doğrultusunda yapılandırılır. Deneysel sonuçlar, durum uzayında gerçekleştirilen uygulamanın geçerliliğini göstermek için sunulmuştur.

Özet (Çeviri)

ABSTRACT Masters Thesis MODULAR - FUZZY REINFORCEMENT LEARNING İrfan GÜLTEKİN Fırat University Graduate School of Natural and Applied Sciences Department of Computer Engineering 2002, Page: 46 The application of reinforcement learning to multi-agent systems has attracted recent attention. In multi-agent systems, the state space to be handled constitutes a major problem efficiently in learning of agents. In order to cooperate agents in the same environment, it is needed to observe and evaluate the action of other agents in the multi-agent system. This case increases the dimension of state space proportional to the number of agents, exponentially. This theses presents a novel approach to overcome this problem. The approach uses together the advantages of the modular architecture, estimation of internal model and fuzzy logic in multi-agent systems. In our cooperation method, one agent estimates its action according to the internal model of the other agent. The internal model is acquired by the observation and evaluation of the other agent's actions. Fuzzy logic maps from input fuzzy sets, representing state space of each learning module to the output fuzzy sets representing the action space. The fuzzy rule base of each learning module is built through the Q-learning. Experimental results handled on pursuit domain show the effectiveness and applicability of the proposed approach.

Benzer Tezler

  1. Çoklu eleman takviyeli öğrenmeye veri madenciliği tabanlı yeni yaklaşımlar

    Data mining based novel approaches to multiagent reinforcement learning

    MEHMET KAYA

    Doktora

    Türkçe

    Türkçe

    2003

    Elektrik ve Elektronik MühendisliğiFırat Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    DOÇ. DR. AHMET ARSLAN

  2. Yapay sinir ağlarında öğrenme algoritmalarının analizi

    Analysis of learning algorithms in neural networks

    SEVİNÇ BAKLAVACI

  3. The role of oxidative stress factors in the pathophysiology of Ocular Rosacea, analysis of tears and other materials

    Oküler Rosacea patofizyolojisinde oksidatif stres faktörlerinin rolü, gözyaşı ve diğer materyallerin analizi

    NİLÜFER YEŞİLIRMAK

    Doktora

    İngilizce

    İngilizce

    2023

    BiyokimyaGazi Üniversitesi

    Tıbbi Biyokimya Ana Bilim Dalı

    PROF. DR. NESLİHAN BUKAN

    PROF. DR. JEAN-LOUIS BOURGES

  4. Washing machine product family design with modular product design approach

    Modüler ürün tasarımı yaklaşımıyla çamaşır makinesi ürün ailesi tasarımı

    TUBA DOLAR

    Yüksek Lisans

    İngilizce

    İngilizce

    2021

    Makine Mühendisliğiİstanbul Teknik Üniversitesi

    Makine Mühendisliği Ana Bilim Dalı

    PROF. DR. ATA MUGAN

  5. Otonom simetrik mobil robotun bulanık mantık ve derin öğrenme tabanlı konum kontrolünün gerçekleştirilmesi

    Realization of fuzzy logic and deep learning based position control of autonomous symmetric mobile robot

    AHMET TOP

    Doktora

    Türkçe

    Türkçe

    2023

    Elektrik ve Elektronik MühendisliğiFırat Üniversitesi

    Elektrik-Elektronik Mühendisliği Teknolojileri Ana Bilim Dalı

    PROF. DR. MUAMMER GÖKBULUT