Geri Dön

Pekiştirmeli öğrenme problemlerinde keşif ve genelleştirme yöntemleri

Exploration and generalization methods in reinforcement learning problems

  1. Tez No: 623467
  2. Yazar: KIVANÇ GÜÇKIRAN
  3. Danışmanlar: DR. ÖĞR. ÜYESİ BÜLENT BOLAT
  4. Tez Türü: Yüksek Lisans
  5. Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2020
  8. Dil: Türkçe
  9. Üniversite: Yıldız Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Elektronik Bilim Dalı
  13. Sayfa Sayısı: 43

Özet

Makine öğrenmesinin alt başlığı olan pekiştirmeli öğrenme, bir hedefe dair en uygun politikayı bulmayı amaçlayan ve çeşitli algoritmaların birleşiminden oluşan bir yöntemler bütünüdür. Bu hedef bir çok alt görev tanımından oluşabileceği gibi yalnızca bir başarımdan oluşabilir. Bir çok makine öğrenmesi konsepti gibi, pekiştirmeli öğrenmenin de kendisine has bazı problemleri bulunmaktadır. Bu problemler hedeflenen politikanın en uygun olmayan yapıya yakınsamasına yol açabilmektedir. Bu yakınsama, ortamın dinamiklerini yeterince keşfetmeden karara ulaşmasından yahut, karşılaşılmayan dinamikler ile karşılaşıldığı durumda genelleyememesinden kaynaklanmaktadır. Bu çalışmada, TORCS ortamında otonom bir şekilde yarışan bir başarılı ve uygun bir politika bulunmaya çalışıldı. Keşif ve genelleştirme problemlerini en aza indirgemek için bir çok yöntem dikkate alındı ve kullanıldı. Bir çok iyileştirmeyle beraber Soft-Actor-Critic algoritması kullanılarak başarılı bir politika elde edildi.

Özet (Çeviri)

Reinforcement Learning, which is a sub-component of machine learning algorithms, is a collection of algorithms which try to find the optimal policy regarding a goal. This goal might be overcoming a plethora of tasks or a single achievement. Like many machine learning concepts, Reinforcement Learning algorithms have some drawbacks which make the method converge to a non-optimal policy. These drawbacks mainly occur because of the early exploitation of the environment by the policy or lacking the ability of generalizing to unseen dynamics of the environments. In this study, we have tried to achieve an optimal autonomous car racing policy in The Open Racing Car Simulator environment. Multiple approaches are taken into account to achieve exploration and generalization over environment. We had significant success with Soft-Actor-Critic algorithm with improvements over several environmental factors.

Benzer Tezler

  1. Hierarchical reinforcement learning in complex wargame environments

    Kompleks savaş oyunu ortamlarında hiyerarşik pekiştirmeli öğrenme

    KUBİLAY KAĞAN KÖMÜRCÜ

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Astronomi ve Uzay Bilimleriİstanbul Teknik Üniversitesi

    Uçak ve Uzay Mühendisliği Ana Bilim Dalı

    DOÇ. DR. NAZIM KEMAL ÜRE

  2. Investigating the effects of representation learning on exploration in on-policy reinforcement learning

    Temsil öğrenmesinin politikalı pekiştirmeli öğrenmedeki keşif üzerindeki etkilerinin incelenmesi

    CAN GÖZPINAR

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKoç Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ BARIŞ AKGÜN

  3. Quadcopter trajectory tracking control using reinforcement learning

    Pekiştirmeli öğrenme ile quadcopter yörünge takibi kontrolü

    MUSTAFA ERDEM

    Yüksek Lisans

    İngilizce

    İngilizce

    2019

    Mekatronik Mühendisliğiİstanbul Teknik Üniversitesi

    Mekatronik Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ERDİNÇ ALTUĞ

  4. GAN-based intrinsic exploration for sample efficient reinforcement learning

    Örnek verimli pekiştirmeli öğrenme için üretken çekişmeli ağlarla içsel keşif

    DOĞAY KAMAR

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. GÖZDE ÜNAL

  5. Automated curriculum design for reinforcement learning with graph theory and evaluation heuristics

    Çizge kuramı ve değerlendirme bazlı sezgisel yöntemler ile pekiştirmeli öğrenme için otomatik müfredat tasarımı

    ANIL ÖZTÜRK

    Yüksek Lisans

    İngilizce

    İngilizce

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. NAZIM KEMAL ÜRE