Geri Dön

Çoklu eleman takviyeli öğrenmeye veri madenciliği tabanlı yeni yaklaşımlar

Data mining based novel approaches to multiagent reinforcement learning

  1. Tez No: 134813
  2. Yazar: MEHMET KAYA
  3. Danışmanlar: DOÇ. DR. AHMET ARSLAN
  4. Tez Türü: Doktora
  5. Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
  6. Anahtar Kelimeler: Çoklu etmen takviye öğrenme, Veri madenciliği, Bağıntı kuralları, Çevrim-içi analitik işleme, Bulanık kümeler. %c Ytmss&ûCRrnm kurgu* VI, Multiagent reinforcement learning, data mining, association rules, online analytical processing, fuzzy sets. VII
  7. Yıl: 2003
  8. Dil: Türkçe
  9. Üniversite: Fırat Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 101

Özet

ÖZET Doktora Tezi ÇOKLU ETMEN TAKVİYELİ ÖĞRENMEYE VERİ MADENCİLİĞİ TABANLI YENİ YAKLAŞIMLAR Mehmet KAYA Fırat Üniversitesi Fen Bilimleri Enstitüsü Elektrik ve Elektronik Mühendisliği 2003, Sayfa: 91 Takviye öğrenme, çoklu etmen sistemlerde öğrenme için güçlü bir yöntem olarak önerilmiştir. Buna karşılık, ortamda bulunan diğer etmenleri modelleme ve öğrenme boyunca bazı durumların gereğinden fazla tecrübelenmesi gibi problemleri de içerir. Bir taraftan bazı durumların yeterince tecrübelenmediği halde etmenden uygun bir hareket seçmesi beklenirken, diğer bir taraftan öğrenme süreci tamamlanmadan önce etmenden yeterince tecrübelendiği durumlarda bile kesin bir davranış sergilemesine izin verilmez. Bu da öğrenme süresinin artmasına neden olur. Bu durum, kısmen gözlenebilir ve dinamik çoklu etmen ortamındaki öğrenmenin hala bazı zorluklar içerdiğini ve daha detaylı incelenmesi gereken önemli bir araştırma problemi olduğunu gösterir. Yukarıda ifade edilen problemleri ele almak için, bu tezde birlikte çalışarak öğrenen bir sistem için yeni çoklu etmen öğrenme yöntemleri sunulmuştur. Yöntemler, etmenler tarafından elde edilen bilgiyi etkili işlemek için bulanıklık kavramını ve çevrim-içi analitik işlem (online analytical processing) madenciliğini birleştirmektedir. Bu maksatla öncelikle, etmenlerin durum bilgilerini depolama ve işlemeye imkan veren bulanık bir veri küpü tanımlanmıştır. Böylece diğer etmenin hareketi, göz önüne alman etmenin görme alanının dışında olması durumunda bile çevrim-içi bağıntı kuralları yardımıyla tahmin edildi. Daha sonra, yine bağıntı kurallarına dayanan yeni bir hareket seçme yöntemi önerildi. Bu maksatla, önerilen veri küplerinden çok seviyeli bağıntı kuralları çıkarılarak, yeterince tecrübelenmemiş durumlar genelleştirildi. Son olarak, çoklu etmen ortamda, etmenler tarafından karşılaşılan yavaş yakınsama hızı ve yakınsama adım sayısı gibi problemlerin üstesinden gelmek için, yeni ve güçlü bir modüler mimari ve buna uygun öğrenme yaklaşımı sunuldu. Ayrıca, modüler mimari ile daha önce tanımlanan bütün yöntemler başarılı bir şekilde birleştirildi. İyi bilinen, iki farklı av/avcı problemi üzerinde gerçekleştirilen uygulama sonuçlan önerilen öğrenme yaklaşımlarının gücünü ve etkisini gösterdi.

Özet (Çeviri)

ABSTRACT PhD Thesis DATA MINING BASED NOVEL APPROACHES TO MULTIAGENT REINFORCEMENT LEARNING Mehmet KAYA Fırat University Graduate School of Natural and Applied Sciences Department of Electrical and Electronics Engineering 2003, Page: 91 Reinforcement learning is considered as a strong method for learning in multiagent systems environments. However, it still has some drawbacks, including modeling other learning agents present in the domain as part of the state of the environment, and experiencing some states more than needed during the learning phase. On one hand, although some states are not experienced sufficiently, it is expected that an agent has to select an appropriate action in each state. On the other hand, before the learning process is completed, it is not given permission for an agent to exhibit a certain behavior in some states that may be experienced sufficiently. This causes the increment of the learning time. This case shows that learning in a partially observable and dynamic multiagent systems environment still constitutes a difficult and major research problem that worth further investigation. In order to handle the problems mentioned above, in this thesis, we propose novel multiagent learning approaches for a cooperative learning system. Our approaches incorporate fuzziness and online analytical processing (OLAP) based data mining to effectively process the information reported by the agents. First, we describe a fuzzy data cube OLAP architecture which facilitates effective storage and processing of the state information reported by agents. This way, the action of the other agent, even not in the visual environment of the agent under consideration, can simply be estimated by extracting online association rules, a well-known data mining technique, from the constructed data cube. Second, we present a new action selection model which is also based on association rules mining. Then, we generalize states which are not experienced sufficiently by mining multiple-levels association rules from the proposed data cubes. Finally, we present a new and robust modular architecture and a corresponding learning approach to overcome the various problems encountered by the agents in multiagent environment, such as slow convergence speed and the number of steps to convergence. Then, we successfully combine advantages of the modular approach with all of the features described above. Results obtained for a well-known pursuit domain show the robustness and effectiveness of the proposed mining based learning approaches.

Benzer Tezler

  1. Design and optimization of variable stiffness composite structures modeled using Bézier curves

    Bézier eğrileriyle modellenen değişken katılıklı kompozit yapıların tasarımı ve optimizasyonu

    ONUR COŞKUN

    Doktora

    İngilizce

    İngilizce

    2022

    Havacılık ve Uzay Mühendisliğiİstanbul Teknik Üniversitesi

    Uçak ve Uzay Mühendisliği Ana Bilim Dalı

    PROF. DR. HALİT SÜLEYMAN TÜRKMEN

  2. Nonlinear stress analysis of composite laminated

    Tabakalı kompozit plaklarda doğrusal olmayan gerilme analizi

    AHMET YAPICI

    Yüksek Lisans

    İngilizce

    İngilizce

    1998

    Makine MühendisliğiDokuz Eylül Üniversitesi

    Makine Mühendisliği Ana Bilim Dalı

    PROF. DR. ONUR SAYMAN

  3. Determination of effective breadth width of stiffened steel plate structures based on nonlinear finite element analysis

    Başlık çevirisi yok

    BURAK TALHA KILIÇ

    Yüksek Lisans

    İngilizce

    İngilizce

    2019

    İnşaat MühendisliğiÖzyeğin Üniversitesi

    İnşaat Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ BÜLENT ERKMEN

  4. Eksenel yüke maruz güçlendirilmiş elips enkesitli kaynaklı T birleşimlerin davranışlarının incelenmesi

    Investigation of the behaviour of reinforced elliptical hollow section welded joints exposed to axial load

    BÜŞRA SARI

    Yüksek Lisans

    Türkçe

    Türkçe

    2021

    İnşaat MühendisliğiGümüşhane Üniversitesi

    İnşaat Mühendisliği Ana Bilim Dalı

    DOÇ. DR. EMRE ÖZYURT

  5. Deformation behavior of thin walled structures filled with auxetic and non-auxetic core materials

    Ökzetik ve ökzetik olmayan dolgu malzemeli ince cidarlı yapıların deformasyon davranışı

    FATİH USTA

    Doktora

    İngilizce

    İngilizce

    2021

    Uçak Mühendisliğiİstanbul Teknik Üniversitesi

    Uçak ve Uzay Mühendisliği Ana Bilim Dalı

    PROF. DR. HALİT SÜLEYMAN TÜRKMEN

    PROF. DR. FABRIZIO SCARPA