Çoklu eleman takviyeli öğrenmeye veri madenciliği tabanlı yeni yaklaşımlar

Data mining based novel approaches to multiagent reinforcement learning

PDF İndir

Tez No: 134813
Yazar: MEHMET KAYA
Danışmanlar: DOÇ. DR. AHMET ARSLAN
Tez Türü: Doktora
Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
Anahtar Kelimeler: Çoklu etmen takviye öğrenme, Veri madenciliği, Bağıntı kuralları, Çevrim-içi analitik işleme, Bulanık kümeler. %c Ytmss&ûCRrnm kurgu* VI, Multiagent reinforcement learning, data mining, association rules, online analytical processing, fuzzy sets. VII
Yıl: 2003
Dil: Türkçe
Üniversite: Fırat Üniversitesi
Enstitü: Fen Bilimleri Enstitüsü
Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
Bilim Dalı: Belirtilmemiş.
Sayfa Sayısı: 101

Özet

ÖZET Doktora Tezi ÇOKLU ETMEN TAKVİYELİ ÖĞRENMEYE VERİ MADENCİLİĞİ TABANLI YENİ YAKLAŞIMLAR Mehmet KAYA Fırat Üniversitesi Fen Bilimleri Enstitüsü Elektrik ve Elektronik Mühendisliği 2003, Sayfa: 91 Takviye öğrenme, çoklu etmen sistemlerde öğrenme için güçlü bir yöntem olarak önerilmiştir. Buna karşılık, ortamda bulunan diğer etmenleri modelleme ve öğrenme boyunca bazı durumların gereğinden fazla tecrübelenmesi gibi problemleri de içerir. Bir taraftan bazı durumların yeterince tecrübelenmediği halde etmenden uygun bir hareket seçmesi beklenirken, diğer bir taraftan öğrenme süreci tamamlanmadan önce etmenden yeterince tecrübelendiği durumlarda bile kesin bir davranış sergilemesine izin verilmez. Bu da öğrenme süresinin artmasına neden olur. Bu durum, kısmen gözlenebilir ve dinamik çoklu etmen ortamındaki öğrenmenin hala bazı zorluklar içerdiğini ve daha detaylı incelenmesi gereken önemli bir araştırma problemi olduğunu gösterir. Yukarıda ifade edilen problemleri ele almak için, bu tezde birlikte çalışarak öğrenen bir sistem için yeni çoklu etmen öğrenme yöntemleri sunulmuştur. Yöntemler, etmenler tarafından elde edilen bilgiyi etkili işlemek için bulanıklık kavramını ve çevrim-içi analitik işlem (online analytical processing) madenciliğini birleştirmektedir. Bu maksatla öncelikle, etmenlerin durum bilgilerini depolama ve işlemeye imkan veren bulanık bir veri küpü tanımlanmıştır. Böylece diğer etmenin hareketi, göz önüne alman etmenin görme alanının dışında olması durumunda bile çevrim-içi bağıntı kuralları yardımıyla tahmin edildi. Daha sonra, yine bağıntı kurallarına dayanan yeni bir hareket seçme yöntemi önerildi. Bu maksatla, önerilen veri küplerinden çok seviyeli bağıntı kuralları çıkarılarak, yeterince tecrübelenmemiş durumlar genelleştirildi. Son olarak, çoklu etmen ortamda, etmenler tarafından karşılaşılan yavaş yakınsama hızı ve yakınsama adım sayısı gibi problemlerin üstesinden gelmek için, yeni ve güçlü bir modüler mimari ve buna uygun öğrenme yaklaşımı sunuldu. Ayrıca, modüler mimari ile daha önce tanımlanan bütün yöntemler başarılı bir şekilde birleştirildi. İyi bilinen, iki farklı av/avcı problemi üzerinde gerçekleştirilen uygulama sonuçlan önerilen öğrenme yaklaşımlarının gücünü ve etkisini gösterdi.

Özet (Çeviri)

ABSTRACT PhD Thesis DATA MINING BASED NOVEL APPROACHES TO MULTIAGENT REINFORCEMENT LEARNING Mehmet KAYA Fırat University Graduate School of Natural and Applied Sciences Department of Electrical and Electronics Engineering 2003, Page: 91 Reinforcement learning is considered as a strong method for learning in multiagent systems environments. However, it still has some drawbacks, including modeling other learning agents present in the domain as part of the state of the environment, and experiencing some states more than needed during the learning phase. On one hand, although some states are not experienced sufficiently, it is expected that an agent has to select an appropriate action in each state. On the other hand, before the learning process is completed, it is not given permission for an agent to exhibit a certain behavior in some states that may be experienced sufficiently. This causes the increment of the learning time. This case shows that learning in a partially observable and dynamic multiagent systems environment still constitutes a difficult and major research problem that worth further investigation. In order to handle the problems mentioned above, in this thesis, we propose novel multiagent learning approaches for a cooperative learning system. Our approaches incorporate fuzziness and online analytical processing (OLAP) based data mining to effectively process the information reported by the agents. First, we describe a fuzzy data cube OLAP architecture which facilitates effective storage and processing of the state information reported by agents. This way, the action of the other agent, even not in the visual environment of the agent under consideration, can simply be estimated by extracting online association rules, a well-known data mining technique, from the constructed data cube. Second, we present a new action selection model which is also based on association rules mining. Then, we generalize states which are not experienced sufficiently by mining multiple-levels association rules from the proposed data cubes. Finally, we present a new and robust modular architecture and a corresponding learning approach to overcome the various problems encountered by the agents in multiagent environment, such as slow convergence speed and the number of steps to convergence. Then, we successfully combine advantages of the modular approach with all of the features described above. Results obtained for a well-known pursuit domain show the robustness and effectiveness of the proposed mining based learning approaches.

Benzer Tezler

Tez No
947374
Performance of historical bridge subjected to theblast loads
Patlama yüklerıne maruz kalan tarıhı köprününperformansı
AMIN BAGHERZADEH AZAR
Doktora
İngilizce
2025
Mühendislik Bilimleri İstanbul Teknik Üniversitesi
Deprem Mühendisliği Ana Bilim Dalı
PROF. DR. ALİ SARI
Tez No
736166
Design and optimization of variable stiffness composite structures modeled using Bézier curves
Bézier eğrileriyle modellenen değişken katılıklı kompozit yapıların tasarımı ve optimizasyonu
ONUR COŞKUN
Doktora
İngilizce
2022
Havacılık ve Uzay Mühendisliği İstanbul Teknik Üniversitesi
Uçak ve Uzay Mühendisliği Ana Bilim Dalı
PROF. DR. HALİT SÜLEYMAN TÜRKMEN
Tez No
77305
Nonlinear stress analysis of composite laminated
Tabakalı kompozit plaklarda doğrusal olmayan gerilme analizi
AHMET YAPICI
Yüksek Lisans
İngilizce
1998
Makine Mühendisliği Dokuz Eylül Üniversitesi
Makine Mühendisliği Ana Bilim Dalı
PROF. DR. ONUR SAYMAN
Tez No
575422
Determination of effective breadth width of stiffened steel plate structures based on nonlinear finite element analysis
Başlık çevirisi yok
BURAK TALHA KILIÇ
Yüksek Lisans
İngilizce
2019
İnşaat Mühendisliği Özyeğin Üniversitesi
İnşaat Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ BÜLENT ERKMEN
Tez No
685354
Eksenel yüke maruz güçlendirilmiş elips enkesitli kaynaklı T birleşimlerin davranışlarının incelenmesi
Investigation of the behaviour of reinforced elliptical hollow section welded joints exposed to axial load
BÜŞRA SARI
Yüksek Lisans
Türkçe
2021
İnşaat Mühendisliği Gümüşhane Üniversitesi
İnşaat Mühendisliği Ana Bilim Dalı
DOÇ. DR. EMRE ÖZYURT

Geri Dön