Geri Dön

Bipedal robot walking by reinforcement learning inpartially observed environment

Pekiştiırmeli öğrenme yöntemleriyle kısmi gözlenebilirortamda çift bacaklı robotun yürütülmesi

  1. Tez No: 688562
  2. Yazar: UĞURCAN ÖZALP
  3. Danışmanlar: PROF. DR. ÖMÜR UĞUR
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Matematik, Computer Engineering and Computer Science and Control, Mathematics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2021
  8. Dil: İngilizce
  9. Üniversite: Orta Doğu Teknik Üniversitesi
  10. Enstitü: Uygulamalı Matematik Enstitüsü
  11. Ana Bilim Dalı: Bilimsel Hesaplama Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 78

Özet

Mekanik kontrol üzerine Derin Pekiştirmeli Öğrenme yöntemleri birçok ortamda başarıyla uygulanmış ve bazı karmaşık problemler için geleneksel optimal ve uyarlanabilir kontrol yöntemleri yerine kullanılmıştır. Bununla birlikte, Derin Pekiştirmeli Öğrenme algoritmalarının hala bazı zorlukları vardır. Bunlardan bir tanesi, kısmen gözlemlenebilir ortamlarda özneyi kontrol etmektir. Bir özne ortam hakkında yeterince bilgilendirilmediğinde, geçmiş gözlemleri anlık gözlemlere ek olarak kullanmalıdır. Bu tezde kısmen gözlemlenebilir olan Bipedal Walker Hardcore (OpenAI GYM) ortamında yürüme kontrolü, iki sürekli aktör-eleştirmen pekiştirmeli öğrenme algoritması tarafından incelenmiştir; İkiz Gecikmeli Derin Belirleyici Poliçe Gradyanı (Twin Delayed Deep Determinstic Policy Gradient) ve Hafif Aktör Eleştirmen (Soft Actor-Critic). Birkaç sinir mimarisi uygulanmıştır. Birincisi, gözlemlenebilir ortam varsayımına göre Artık Bağlantılı İleri Beslemeli Sinir Ağı iken ikincisi ve üçüncüsü, ortamın kısmen gözlemlenebilir olduğu varsayıldığından, gizli durumu kurtarmak için girdi olarak gözlem geçmişini kullanan Uzun Kısa Süreli Bellek (LSTM) ve Transformatördür (Transformer).

Özet (Çeviri)

Deep Reinforcement Learning methods on mechanical control have been successfully applied in many environments and used instead of traditional optimal and adaptive control methods for some complex problems. However, Deep Reinforcement Learning algorithms do still have some challenges. One is to control on partially observable environments. When an agent is not informed well of the environment, it must recover information from the past observations. In this thesis, walking of Bipedal Walker Hardcore (OpenAI GYM) environment, which is partially observable, is studied by two continuous actor-critic reinforcement learning algorithms; Twin Delayed Deep Determinstic Policy Gradient and Soft Actor-Critic. Several neural architectures are implemented. The first one is Residual Feed Forward Neural Network under the observable environment assumption, while the second and the third ones are Long Short Term Memory and Transformer using observation history as input to recover the hidden information due to the partially observable environment.

Benzer Tezler

  1. Derin pekiştirmeli öğrenme kullanarak insansı robotlar için itme kurtarma kontrolsisteminin geliştirilmesi

    Development of push-recovery control system for humanoid robots using deep reinforcement learning

    EMRAH ASLAN

    Doktora

    Türkçe

    Türkçe

    2023

    Elektrik ve Elektronik MühendisliğiDicle Üniversitesi

    Elektrik ve Elektronik Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ MUHAMMET ALİ ARSERİM

    PROF. DR. AYŞEGÜL UÇAR

  2. İki ayaklı yürüyen robot için kontrol sistemi geliştirilmesi

    Control system development for bipedal walking robot

    NUMAN MERT TAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2012

    Mekatronik Mühendisliğiİstanbul Teknik Üniversitesi

    Mekatronik Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. ZEKİ YAĞIZ BAYRAKTAROĞLU

  3. Bipedal humanoid robot walking reference tuning by the use of evolutionary algorithms

    İki bacakli insansi robotlar için evrimsel algoritmalar kullanilarak yürüme referansi ayarlanmasi

    TUNC AKBAS

    Yüksek Lisans

    İngilizce

    İngilizce

    2012

    Mekatronik MühendisliğiSabancı Üniversitesi

    Mekatronik Mühendisliği Ana Bilim Dalı

    DOÇ. DR. KEMALETTİN ERBATUR

  4. İki ayaklı yürüyen robot dinamiğinin deneysel ve teorik araştırılması

    Experimental and theoretical research of biped walking robot dynamics

    TAŞKIN TEZ

    Doktora

    Türkçe

    Türkçe

    2017

    Makine MühendisliğiTrakya Üniversitesi

    Makine Mühendisliği Ana Bilim Dalı

    DOÇ. DR. HİLMİ KUŞÇU

  5. İki ayaklı yürüyen robot tasarımı ve prototip imalatı

    Design and contruction of 12 dof biped robot

    ALPER GERÇEK

    Yüksek Lisans

    Türkçe

    Türkçe

    2012

    Makine Mühendisliğiİstanbul Teknik Üniversitesi

    Makine Ana Bilim Dalı

    PROF. DR. HİKMET KOCABAŞ

    YRD. DOÇ. DR. ZEKİ YAĞIZ BAYRAKTAROĞLU