Pekiştirmeli öğrenme problemlerinde keşif ve genelleştirme yöntemleri
Exploration and generalization methods in reinforcement learning problems
- Tez No: 623467
- Danışmanlar: DR. ÖĞR. ÜYESİ BÜLENT BOLAT
- Tez Türü: Yüksek Lisans
- Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2020
- Dil: Türkçe
- Üniversite: Yıldız Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Elektronik Bilim Dalı
- Sayfa Sayısı: 43
Özet
Makine öğrenmesinin alt başlığı olan pekiştirmeli öğrenme, bir hedefe dair en uygun politikayı bulmayı amaçlayan ve çeşitli algoritmaların birleşiminden oluşan bir yöntemler bütünüdür. Bu hedef bir çok alt görev tanımından oluşabileceği gibi yalnızca bir başarımdan oluşabilir. Bir çok makine öğrenmesi konsepti gibi, pekiştirmeli öğrenmenin de kendisine has bazı problemleri bulunmaktadır. Bu problemler hedeflenen politikanın en uygun olmayan yapıya yakınsamasına yol açabilmektedir. Bu yakınsama, ortamın dinamiklerini yeterince keşfetmeden karara ulaşmasından yahut, karşılaşılmayan dinamikler ile karşılaşıldığı durumda genelleyememesinden kaynaklanmaktadır. Bu çalışmada, TORCS ortamında otonom bir şekilde yarışan bir başarılı ve uygun bir politika bulunmaya çalışıldı. Keşif ve genelleştirme problemlerini en aza indirgemek için bir çok yöntem dikkate alındı ve kullanıldı. Bir çok iyileştirmeyle beraber Soft-Actor-Critic algoritması kullanılarak başarılı bir politika elde edildi.
Özet (Çeviri)
Reinforcement Learning, which is a sub-component of machine learning algorithms, is a collection of algorithms which try to find the optimal policy regarding a goal. This goal might be overcoming a plethora of tasks or a single achievement. Like many machine learning concepts, Reinforcement Learning algorithms have some drawbacks which make the method converge to a non-optimal policy. These drawbacks mainly occur because of the early exploitation of the environment by the policy or lacking the ability of generalizing to unseen dynamics of the environments. In this study, we have tried to achieve an optimal autonomous car racing policy in The Open Racing Car Simulator environment. Multiple approaches are taken into account to achieve exploration and generalization over environment. We had significant success with Soft-Actor-Critic algorithm with improvements over several environmental factors.
Benzer Tezler
- Hierarchical reinforcement learning in complex wargame environments
Kompleks savaş oyunu ortamlarında hiyerarşik pekiştirmeli öğrenme
KUBİLAY KAĞAN KÖMÜRCÜ
Yüksek Lisans
İngilizce
2024
Astronomi ve Uzay Bilimleriİstanbul Teknik ÜniversitesiUçak ve Uzay Mühendisliği Ana Bilim Dalı
DOÇ. DR. NAZIM KEMAL ÜRE
- Investigating the effects of representation learning on exploration in on-policy reinforcement learning
Temsil öğrenmesinin politikalı pekiştirmeli öğrenmedeki keşif üzerindeki etkilerinin incelenmesi
CAN GÖZPINAR
Yüksek Lisans
İngilizce
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKoç ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ BARIŞ AKGÜN
- Quadcopter trajectory tracking control using reinforcement learning
Pekiştirmeli öğrenme ile quadcopter yörünge takibi kontrolü
MUSTAFA ERDEM
Yüksek Lisans
İngilizce
2019
Mekatronik Mühendisliğiİstanbul Teknik ÜniversitesiMekatronik Mühendisliği Ana Bilim Dalı
DOÇ. DR. ERDİNÇ ALTUĞ
- GAN-based intrinsic exploration for sample efficient reinforcement learning
Örnek verimli pekiştirmeli öğrenme için üretken çekişmeli ağlarla içsel keşif
DOĞAY KAMAR
Yüksek Lisans
İngilizce
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. GÖZDE ÜNAL
- Automated curriculum design for reinforcement learning with graph theory and evaluation heuristics
Çizge kuramı ve değerlendirme bazlı sezgisel yöntemler ile pekiştirmeli öğrenme için otomatik müfredat tasarımı
ANIL ÖZTÜRK
Yüksek Lisans
İngilizce
2021
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. NAZIM KEMAL ÜRE