Çoklu eleman takviyeli öğrenmeye veri madenciliği tabanlı yeni yaklaşımlar
Data mining based novel approaches to multiagent reinforcement learning
- Tez No: 134813
- Danışmanlar: DOÇ. DR. AHMET ARSLAN
- Tez Türü: Doktora
- Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
- Anahtar Kelimeler: Çoklu etmen takviye öğrenme, Veri madenciliği, Bağıntı kuralları, Çevrim-içi analitik işleme, Bulanık kümeler. %c Ytmss&ûCRrnm kurgu* VI, Multiagent reinforcement learning, data mining, association rules, online analytical processing, fuzzy sets. VII
- Yıl: 2003
- Dil: Türkçe
- Üniversite: Fırat Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 101
Özet
ÖZET Doktora Tezi ÇOKLU ETMEN TAKVİYELİ ÖĞRENMEYE VERİ MADENCİLİĞİ TABANLI YENİ YAKLAŞIMLAR Mehmet KAYA Fırat Üniversitesi Fen Bilimleri Enstitüsü Elektrik ve Elektronik Mühendisliği 2003, Sayfa: 91 Takviye öğrenme, çoklu etmen sistemlerde öğrenme için güçlü bir yöntem olarak önerilmiştir. Buna karşılık, ortamda bulunan diğer etmenleri modelleme ve öğrenme boyunca bazı durumların gereğinden fazla tecrübelenmesi gibi problemleri de içerir. Bir taraftan bazı durumların yeterince tecrübelenmediği halde etmenden uygun bir hareket seçmesi beklenirken, diğer bir taraftan öğrenme süreci tamamlanmadan önce etmenden yeterince tecrübelendiği durumlarda bile kesin bir davranış sergilemesine izin verilmez. Bu da öğrenme süresinin artmasına neden olur. Bu durum, kısmen gözlenebilir ve dinamik çoklu etmen ortamındaki öğrenmenin hala bazı zorluklar içerdiğini ve daha detaylı incelenmesi gereken önemli bir araştırma problemi olduğunu gösterir. Yukarıda ifade edilen problemleri ele almak için, bu tezde birlikte çalışarak öğrenen bir sistem için yeni çoklu etmen öğrenme yöntemleri sunulmuştur. Yöntemler, etmenler tarafından elde edilen bilgiyi etkili işlemek için bulanıklık kavramını ve çevrim-içi analitik işlem (online analytical processing) madenciliğini birleştirmektedir. Bu maksatla öncelikle, etmenlerin durum bilgilerini depolama ve işlemeye imkan veren bulanık bir veri küpü tanımlanmıştır. Böylece diğer etmenin hareketi, göz önüne alman etmenin görme alanının dışında olması durumunda bile çevrim-içi bağıntı kuralları yardımıyla tahmin edildi. Daha sonra, yine bağıntı kurallarına dayanan yeni bir hareket seçme yöntemi önerildi. Bu maksatla, önerilen veri küplerinden çok seviyeli bağıntı kuralları çıkarılarak, yeterince tecrübelenmemiş durumlar genelleştirildi. Son olarak, çoklu etmen ortamda, etmenler tarafından karşılaşılan yavaş yakınsama hızı ve yakınsama adım sayısı gibi problemlerin üstesinden gelmek için, yeni ve güçlü bir modüler mimari ve buna uygun öğrenme yaklaşımı sunuldu. Ayrıca, modüler mimari ile daha önce tanımlanan bütün yöntemler başarılı bir şekilde birleştirildi. İyi bilinen, iki farklı av/avcı problemi üzerinde gerçekleştirilen uygulama sonuçlan önerilen öğrenme yaklaşımlarının gücünü ve etkisini gösterdi.
Özet (Çeviri)
ABSTRACT PhD Thesis DATA MINING BASED NOVEL APPROACHES TO MULTIAGENT REINFORCEMENT LEARNING Mehmet KAYA Fırat University Graduate School of Natural and Applied Sciences Department of Electrical and Electronics Engineering 2003, Page: 91 Reinforcement learning is considered as a strong method for learning in multiagent systems environments. However, it still has some drawbacks, including modeling other learning agents present in the domain as part of the state of the environment, and experiencing some states more than needed during the learning phase. On one hand, although some states are not experienced sufficiently, it is expected that an agent has to select an appropriate action in each state. On the other hand, before the learning process is completed, it is not given permission for an agent to exhibit a certain behavior in some states that may be experienced sufficiently. This causes the increment of the learning time. This case shows that learning in a partially observable and dynamic multiagent systems environment still constitutes a difficult and major research problem that worth further investigation. In order to handle the problems mentioned above, in this thesis, we propose novel multiagent learning approaches for a cooperative learning system. Our approaches incorporate fuzziness and online analytical processing (OLAP) based data mining to effectively process the information reported by the agents. First, we describe a fuzzy data cube OLAP architecture which facilitates effective storage and processing of the state information reported by agents. This way, the action of the other agent, even not in the visual environment of the agent under consideration, can simply be estimated by extracting online association rules, a well-known data mining technique, from the constructed data cube. Second, we present a new action selection model which is also based on association rules mining. Then, we generalize states which are not experienced sufficiently by mining multiple-levels association rules from the proposed data cubes. Finally, we present a new and robust modular architecture and a corresponding learning approach to overcome the various problems encountered by the agents in multiagent environment, such as slow convergence speed and the number of steps to convergence. Then, we successfully combine advantages of the modular approach with all of the features described above. Results obtained for a well-known pursuit domain show the robustness and effectiveness of the proposed mining based learning approaches.
Benzer Tezler
- Design and optimization of variable stiffness composite structures modeled using Bézier curves
Bézier eğrileriyle modellenen değişken katılıklı kompozit yapıların tasarımı ve optimizasyonu
ONUR COŞKUN
Doktora
İngilizce
2022
Havacılık ve Uzay Mühendisliğiİstanbul Teknik ÜniversitesiUçak ve Uzay Mühendisliği Ana Bilim Dalı
PROF. DR. HALİT SÜLEYMAN TÜRKMEN
- Nonlinear stress analysis of composite laminated
Tabakalı kompozit plaklarda doğrusal olmayan gerilme analizi
AHMET YAPICI
Yüksek Lisans
İngilizce
1998
Makine MühendisliğiDokuz Eylül ÜniversitesiMakine Mühendisliği Ana Bilim Dalı
PROF. DR. ONUR SAYMAN
- Determination of effective breadth width of stiffened steel plate structures based on nonlinear finite element analysis
Başlık çevirisi yok
BURAK TALHA KILIÇ
Yüksek Lisans
İngilizce
2019
İnşaat MühendisliğiÖzyeğin Üniversitesiİnşaat Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ BÜLENT ERKMEN
- Eksenel yüke maruz güçlendirilmiş elips enkesitli kaynaklı T birleşimlerin davranışlarının incelenmesi
Investigation of the behaviour of reinforced elliptical hollow section welded joints exposed to axial load
BÜŞRA SARI
Yüksek Lisans
Türkçe
2021
İnşaat MühendisliğiGümüşhane Üniversitesiİnşaat Mühendisliği Ana Bilim Dalı
DOÇ. DR. EMRE ÖZYURT
- Deformation behavior of thin walled structures filled with auxetic and non-auxetic core materials
Ökzetik ve ökzetik olmayan dolgu malzemeli ince cidarlı yapıların deformasyon davranışı
FATİH USTA
Doktora
İngilizce
2021
Uçak Mühendisliğiİstanbul Teknik ÜniversitesiUçak ve Uzay Mühendisliği Ana Bilim Dalı
PROF. DR. HALİT SÜLEYMAN TÜRKMEN
PROF. DR. FABRIZIO SCARPA