Effective reinforcement learning through intrinsic motivation and visual external memory in partially observable environments
Kısmi gözlemlenebilir ortamlarda içsel motivasyon ve görsel harici bellek ile etkili pekiştirmeli öğrenme
- Tez No: 830524
- Danışmanlar: PROF. DR. FARUK POLAT, DR. ÖĞR. ÜYESİ ALPER DEMİR
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Bilim ve Teknoloji, Computer Engineering and Computer Science and Control, Science and Technology
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2023
- Dil: İngilizce
- Üniversite: Orta Doğu Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 126
Özet
Gerçek hayattaki pratik pekiştirmeli öğrenme problemlerinde, problemlerin kısmi gözlemlenebilir olduğu ve optimal çözümler için bazı gözlemlerin uzun süreli hatırlanması gereken durumlarla sıklıkla karşılaşılmaktadır. Bu zorluğa çözüm oluşturulması amacıyla, etmenlere içeriğini kendilerinin yönetebileceği harici görsel bellek mekanizmaları oluşturulup, karar verme kabiliyetleri genişletilmiştir. Geliştirilen bu görsel bellek yönetimi yaklaşımı sayesinde, mevcut gözlem ve harici bellek verileri kullanılarak kısmi gözlemlenebilir senaryolar için etmenlerin bağlamlar oluşturması sağlanabilmektedir. Ayrıca, etmenin bu harici belleği uzun vadede etkili bir şekilde kullanmasını teşvik edebilmek amacıyla, içsel motivasyon yaklaşımları bu problemler için ikincil bir ödül mekanizması olacak şekilde dahil edilmiştir. Bu çalışma sonucu elde edilen ana katkılar arasında, pekiştirmeli öğrenme etmenleri için görsel harici bellek yönetimi çerçevesinin oluşturulması, harici belleğin verimli biçimde kullanılmasına teşvik edilebilmesi amacıyla görsel içsel motivasyon fonksiyonlarının geliştirilmesi, farklı ortamlar üzerinde deneyler gerçekleştirilmesi ve literatürdeki en başarılı yaklaşımlarla karşılaştırılması yer almaktadır. Elde edilen sonuçlar, önerilen yaklaşımların potansiyelini ve avantajlarını vurgulamakta ve bu özel çalışma alanı içinde gelecekteki araştırma için çok sayıda olasılığı okuyucuya sunmaktadır.
Özet (Çeviri)
Reinforcement learning in practical scenarios often includes partial observability that requires long-term remembering of visual observations to obtain optimal policies. Addressing this challenge, this study introduces agents augmented with visual external memories, enhancing agents decision-making capabilities by constructing a context derived from both current observations and memory data. Moreover, to ensure effective utilization of the external memory for the agent, intrinsic motivation is incorporated as a secondary reward system, promoting long-term beneficial behaviors of using memory. Key contributions from this study include a novel framework for integrating visual external memory in reinforcement learning agents, the development of intrinsic motivation functions to efficiently learn how to utilize external memory to improve overall learning, empirical evaluations and experiments in various environments, and detailed comparison and analysis against the state-of-the-art. The results highlight the potential and advantages of the proposed approaches and present numerous possibilities for future investigation within this particular field of study.
Benzer Tezler
- Robotların bilinmeyen cisimlerin tutulabilirliğini içsel motivasyon desteği ile öğrenmesi
Learning graspability of unknown objects via intrinsic motivation
ERÇİN TEMEL
Yüksek Lisans
Türkçe
2015
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. SANEM SARIEL
- Novel deep reinforcement learning algorithms for continuous control
Sürekli kontrol için yeni derin pekiştirmeli öğrenme algoritmaları
BATURAY SAĞLAM
Yüksek Lisans
İngilizce
2023
Elektrik ve Elektronik Mühendisliğiİhsan Doğramacı Bilkent ÜniversitesiElektrik ve Elektronik Mühendisliği Ana Bilim Dalı
PROF. SÜLEYMAN SERDAR KOZAT
- Ortaokul matematik öğretmenlerinin ders işleyiş süreçlerinin incelenmesi
Researching of the middle school math teachers' course processes
ÇAĞLA PINAR ŞENSOY
Yüksek Lisans
Türkçe
2019
Eğitim ve ÖğretimDüzce ÜniversitesiEğitim Bilimleri Ana Bilim Dalı
PROF. DR. ABDURRAHMAN KILIÇ
- Plastik ürün tasarım ilkeleri
Principles of plastic product design
M.ALPER ASLAN
Yüksek Lisans
Türkçe
1997
Makine Mühendisliğiİstanbul Teknik ÜniversitesiMakine Mühendisliği Ana Bilim Dalı
PROF. DR. SELMA AKKURT
- İmalat sistemlerinin tasarlanması ve öncelik kurallarının belirlenmesinde yapay sinir ağlarının kullanılması
Başlık çevirisi yok
TARIK ÇAKAR
Doktora
Türkçe
1997
Mühendislik Bilimleriİstanbul Teknik Üniversitesiİşletme Mühendisliği Ana Bilim Dalı
PROF. DR. AYHAN TORAMAN