Geri Dön

EMDD-RL: Faster subgoal ıdentification with diverse density in reinforcement learning

EMDD-RL: Pekiştirmeli öğrenmede ayrı yoğunluk yöntemiyle daha hızlı alt hedef bulma

  1. Tez No: 657846
  2. Yazar: SAİM SUNEL
  3. Danışmanlar: PROF. DR. FARUK POLAT
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2021
  8. Dil: İngilizce
  9. Üniversite: Orta Doğu Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 118

Özet

Ayrı Yoğunluk (AY) algoritması, pekiştirmeli öğrenme alanında öğrenme sürecini iyileştirmek amacıyla otomatik olarak alt hedefleri bulma konusunda etkili olduğu gösterilmiş, çoklu-örnek öğrenme alanında öne sürülmüş ve bu alanda iyi bilinen bir yöntemdir. Aynı alanda önerilmiş olan Beklenti Yükseltmeli Ayrı Yoğunluk (BYAY) yöntemi, AY metodunu hem doğru sonuç üretme, hem de hızlı çalışma açısından geliştirmiştir. Bu çalışma pekiştirmeli öğrenme problemlerinde otomatik olarak alt hedeflerin tespiti için BYAY metodunu, algoritma üzerinde gerekli değişiklikleri uygulayarak, uyarlamaktadır. Uyarlanan yöntem, atası sayılabilecek olan AY algoritmasıyla tasarlanmış diğer algoritmadan tespit edilen alt hedeflerin kalitesini koruyarak 3 ile 10 kat daha hızlı çalışmaktadır. Tezde EMDD-RL ismiyle önerilmiş olan yöntemin sahip olduğu parametrelerin, algoritmanın performansı üzerindeki etkileri tartışılmış ve ayrıntılı deneylerle ortaya konulmuştur.

Özet (Çeviri)

Diverse Density (DD) algorithm is a well-known multiple instance learning method, also known to be effective to automatically identify sub-goals and improve Reinforcement Learning (RL). Expectation-Maximization Diverse Density (EMDD) improves DD in terms of both speed and accuracy. This study adapts EMDD to automatically identify subgoals for RL which is shown to perform significantly faster (3 to 10 times) than its predecessor, without sacrificing solution quality. The performance of the proposed method named EMDD-RL is empirically shown via extensive experimentation, together with the discussions on the effects of EMDD hyperparameters on the results.

Benzer Tezler

  1. Geç Roma İmparatorluk çağında Roma - Sasani ihtilafları: Roma'nın doğu sınırları

    The Roman- Sassanian conflicts in late Roman period: The eastern borders of Rome

    EMİNE BİLGİÇ

    Yüksek Lisans

    Türkçe

    Türkçe

    2012

    Eski Çağ Dilleri ve KültürleriAkdeniz Üniversitesi

    Eskiçağ Dilleri ve Kültürleri Ana Bilim Dalı

    YRD. DOÇ. DR. NİHAL TÜNER ÖNEN