Geri Dön

Implementation of continuous POMDP algorithms on autonomous robots

Otonom robotlar üzerinde sürekli KGMKS algoritmalarının uygulanması

  1. Tez No: 179077
  2. Yazar: DERYA SEZEN
  3. Danışmanlar: PROF. DR. H. LEVENT AKIN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2008
  8. Dil: İngilizce
  9. Üniversite: Boğaziçi Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Bölümü
  12. Bilim Dalı: Sistem ve Kontrol Mühendisliği Ana Bilim Dalı
  13. Sayfa Sayısı: 94

Özet

Belirsizlik, otonom robotlar için, duyargaların gerçek dünya gibi tüm ortam durumunu tam olarak yansıtamadığı hallerde başedilmesi gereken temel problemlerden biridir. Gerçekleştirilen eylemlerin sonuçlarının ne olacağı önceden bilinmese dahi etmenlerin mantıklı davranışlar içinde bulunmaları beklenmektedir. Bunun yanında ortamın aralıksız dağılımlı zaman yapısı problemi daha da zor hale getirmektedir.Markov Karar Yöntemleri bu tip ortamların modellenmesi için uygundur. Kısmen Gözlemlenebilir Markov Karar Süreçleri ise bütünüyle gözlemlenmesi mümkün olmayan ortamlar için tercih edilmektedir. Bu yöntemlerle ortamın modellenebilmesi için, gerçek dünyanın aralıksız dağılımlı yapısının aralıklı hale getirilmesi gerekmektedir.Bu çalışmanın amacı gerçek dünyayı modelleyerek, Kısmen Gözlemlenebilir Markov Karar Süreçlerine uygun öğrenme algoritmalarının gerçek robotlar üzerinde uygulanmasıdır.Deneyler Sony'nin dört bacaklı AIBO köpek robotları üzerinde, Webots simulasyon ortamı kullanılarak gerçekleştirilmiştir. İki farklı problem üzerinde algoritmalar uygulanmıştır: ``Topa Yaklaşma'' ve ``Gol Atma''. Robotların önceden verilen hedeflere ulaşmayı başardıkları ve gol skorlarında rastgele verilen kararlara nazaran daha başarılı oldukları gözlemlenmiştir. Sonuca ulaşırken gerçekleştirilen eylemlerin optimum olup olmadığı tartışılmış ve bunu etkileyen parametreler açıklanmıştır.

Özet (Çeviri)

Uncertainty is a fundamental problem for autonomous agents in a partially observable real world, where the sensors are not able to give the complete state of the environment. Although the outcomes of actions are not predictable, the agents must behave rationally. Furthermore, continuous nature of the environment makes the problem more difficult to model.Markov Decision Process (MDP) is a way to model this kind of problems. Partially observable Markov decision process (POMDP) is an extension of MDP which can be used in environments which are not fully observable. In order to model the real world, the continuous states must be converted to discrete states.The aim of this work is to model the real world environment and implement ARKAQ learning algorithm which is suitable for Partially observable Markov decision problems (POMDPs).The experiments are realized with Sony AIBO four-legged robotic pets under Webots simulation environment. Two problems are studied: ``Ball Approaching'' and ``Scoring Goal''. The predefined targets are achieved by the robots and the results in goal scoring show that ARKAQ is clearly much more successful compared to random actions. The optimality of the results are discussed and the parameters that affect the optimality are explained.

Benzer Tezler

  1. Bir dişli pompa grubunun imalatında eşzamanlı mühendislik ve grup teknolojisi

    The carrying out of group technology in the concurrent engineering concept on a factory which is manufacturing gear pomp

    ALPER ASLAN

    Yüksek Lisans

    Türkçe

    Türkçe

    1997

    Makine Mühendisliğiİstanbul Teknik Üniversitesi

    Makine Mühendisliği Ana Bilim Dalı

    PROF. DR. TEOMAN KURTAY

  2. Sürekli denetimin iç denetimde uygulanabilirliği ve Türkiye'de ticari bankalar için sürekli denetim yapılandırma modeli

    The implementation of continuous auditing in internal auditing and the continuous auditing infrastructure model for commercial banks in Turkey

    TANSEL ÇETİNOĞLU

    Doktora

    Türkçe

    Türkçe

    2007

    İşletmeDumlupınar Üniversitesi

    İşletme Ana Bilim Dalı

    PROF. DR. ŞERAFETTİN SEVİM

  3. Üniversite kütüphanelerinde sürekli iyileştirme felsefesinin uygulanması; Sakarya Üniversitesi Kütüphanesi örneği

    The implementation of philosophy continuous improvement at university libraries: The example of Sakarya University Library

    ŞENAY KESİM

    Yüksek Lisans

    Türkçe

    Türkçe

    2011

    Bilgi ve Belge YönetimiMarmara Üniversitesi

    Bilgi ve Belge Yönetimi Ana Bilim Dalı

    DOÇ. DR. BERAT BİR BAYRAKTAR

  4. VLSI implementation of a new standard for lossess compression of continious-tone still images

    Devamlı tondaki durağan görüntülerin kayıpsız sıkıştırılmasıyla ilgili yeni standardın çok büyük ölçekli tümleşik devre uygulaması

    A. SUAT AKTÜRK

    Yüksek Lisans

    İngilizce

    İngilizce

    1998

    Elektrik ve Elektronik MühendisliğiBoğaziçi Üniversitesi

    Savunma Teknolojileri Ana Bilim Dalı

    DOÇ. DR. SİNA BALKIR

  5. Altı Sigma yönteminin zeytinyağı sektöründe bir uygulaması

    The implementation of Six Sigma in the olive oil branch

    BİHTER BİÇER OYMAK

    Yüksek Lisans

    Türkçe

    Türkçe

    2015

    İşletmeAdnan Menderes Üniversitesi

    İşletme Ana Bilim Dalı

    YRD. DOÇ. DR. ESİN SAYIN