Effective reinforcement learning through intrinsic motivation and visual external memory in partially observable environments

Kısmi gözlemlenebilir ortamlarda içsel motivasyon ve görsel harici bellek ile etkili pekiştirmeli öğrenme

PDF İndir

Tez No: 830524
Yazar: BURAK HAN DEMİRBİLEK
Danışmanlar: PROF. DR. FARUK POLAT, DR. ÖĞR. ÜYESİ ALPER DEMİR
Tez Türü: Yüksek Lisans
Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Bilim ve Teknoloji, Computer Engineering and Computer Science and Control, Science and Technology
Anahtar Kelimeler: Belirtilmemiş.
Yıl: 2023
Dil: İngilizce
Üniversite: Orta Doğu Teknik Üniversitesi
Enstitü: Fen Bilimleri Enstitüsü
Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
Bilim Dalı: Belirtilmemiş.
Sayfa Sayısı: 126

Özet

Gerçek hayattaki pratik pekiştirmeli öğrenme problemlerinde, problemlerin kısmi gözlemlenebilir olduğu ve optimal çözümler için bazı gözlemlerin uzun süreli hatırlanması gereken durumlarla sıklıkla karşılaşılmaktadır. Bu zorluğa çözüm oluşturulması amacıyla, etmenlere içeriğini kendilerinin yönetebileceği harici görsel bellek mekanizmaları oluşturulup, karar verme kabiliyetleri genişletilmiştir. Geliştirilen bu görsel bellek yönetimi yaklaşımı sayesinde, mevcut gözlem ve harici bellek verileri kullanılarak kısmi gözlemlenebilir senaryolar için etmenlerin bağlamlar oluşturması sağlanabilmektedir. Ayrıca, etmenin bu harici belleği uzun vadede etkili bir şekilde kullanmasını teşvik edebilmek amacıyla, içsel motivasyon yaklaşımları bu problemler için ikincil bir ödül mekanizması olacak şekilde dahil edilmiştir. Bu çalışma sonucu elde edilen ana katkılar arasında, pekiştirmeli öğrenme etmenleri için görsel harici bellek yönetimi çerçevesinin oluşturulması, harici belleğin verimli biçimde kullanılmasına teşvik edilebilmesi amacıyla görsel içsel motivasyon fonksiyonlarının geliştirilmesi, farklı ortamlar üzerinde deneyler gerçekleştirilmesi ve literatürdeki en başarılı yaklaşımlarla karşılaştırılması yer almaktadır. Elde edilen sonuçlar, önerilen yaklaşımların potansiyelini ve avantajlarını vurgulamakta ve bu özel çalışma alanı içinde gelecekteki araştırma için çok sayıda olasılığı okuyucuya sunmaktadır.

Özet (Çeviri)

Reinforcement learning in practical scenarios often includes partial observability that requires long-term remembering of visual observations to obtain optimal policies. Addressing this challenge, this study introduces agents augmented with visual external memories, enhancing agents decision-making capabilities by constructing a context derived from both current observations and memory data. Moreover, to ensure effective utilization of the external memory for the agent, intrinsic motivation is incorporated as a secondary reward system, promoting long-term beneficial behaviors of using memory. Key contributions from this study include a novel framework for integrating visual external memory in reinforcement learning agents, the development of intrinsic motivation functions to efficiently learn how to utilize external memory to improve overall learning, empirical evaluations and experiments in various environments, and detailed comparison and analysis against the state-of-the-art. The results highlight the potential and advantages of the proposed approaches and present numerous possibilities for future investigation within this particular field of study.

Benzer Tezler

Tez No
389254
Robotların bilinmeyen cisimlerin tutulabilirliğini içsel motivasyon desteği ile öğrenmesi
Learning graspability of unknown objects via intrinsic motivation
ERÇİN TEMEL
Yüksek Lisans
Türkçe
2015
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol İstanbul Teknik Üniversitesi
Bilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. SANEM SARIEL
Tez No
828191
Novel deep reinforcement learning algorithms for continuous control
Sürekli kontrol için yeni derin pekiştirmeli öğrenme algoritmaları
BATURAY SAĞLAM
Yüksek Lisans
İngilizce
2023
Elektrik ve Elektronik Mühendisliği İhsan Doğramacı Bilkent Üniversitesi
Elektrik ve Elektronik Mühendisliği Ana Bilim Dalı
PROF. SÜLEYMAN SERDAR KOZAT
Tez No
947990
Modeling brokerage firm behavior in borsa istanbul using inverse reinforcement learning
Ters pekiştirmeli öğrenme yöntemiyle aracı kurum davranışlarının modellenmesi
KUBİLAY KARAÇAM
Yüksek Lisans
İngilizce
2025
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol İstanbul Teknik Üniversitesi
Veri Mühendisliği ve İş Analitiği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ MEHMET YASİN ULUKUŞ
Tez No
573656
Ortaokul matematik öğretmenlerinin ders işleyiş süreçlerinin incelenmesi
Researching of the middle school math teachers' course processes
ÇAĞLA PINAR ŞENSOY
Yüksek Lisans
Türkçe
2019
Eğitim ve Öğretim Düzce Üniversitesi
Eğitim Bilimleri Ana Bilim Dalı
PROF. DR. ABDURRAHMAN KILIÇ
Tez No
66825
Plastik ürün tasarım ilkeleri
Principles of plastic product design
M.ALPER ASLAN
Yüksek Lisans
Türkçe
1997
Makine Mühendisliği İstanbul Teknik Üniversitesi
Makine Mühendisliği Ana Bilim Dalı
PROF. DR. SELMA AKKURT

Geri Dön