Geri Dön

Autonomous strategy planning under uncertainty

Belirsizlik altında özerk strateji geliştirme

  1. Tez No: 181311
  2. Yazar: ALP SARDAĞ
  3. Danışmanlar: PROF. DR. HÜSEYİN LEVENT AKIN
  4. Tez Türü: Doktora
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2006
  8. Dil: İngilizce
  9. Üniversite: Boğaziçi Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 151

Özet

Gerşek dünya, bu ortamdaki etmenler tarafından gürültülü algılayıcılar ya dac u u u uueksik algı nedeniyle kısmi olarak güzlemlenebilir. Belirsizlik altında üzerk stratejio ogeliştirmenin karşısında iki büyük engel vardır. Verilen bir gürev işin sürekli du-s s uu o c urum uzayının üzerk olarak bülgelere ayrılmasıve bu bülgeler uzerinde amaca yüneliko o o ü oügkarmaşık davranışların ortaya şıkarılması. Bu tezde isimleri ARKAQ-Oğrenme, KAFAQ-s s cügOğrenme ve KBVI olan ve şeşitli tekniklerin bir araya getirilmesinden oluşan uş yenics s ücügyaklaşım ünerilmektedir. ARKAQ-Oğrenme yapısında Kalman filtreleme üzelliği ek-so o güg üglenmiş, ART2-A ağı ve Q-Oğrenme metodları kullanılmıştır. KAFAQ-Oğrenme, Kalmans g sügfiltreleme ve Q-Oğrenme yüntemlerini kullanan bir sonlu durum makinasıdır. KBVIoise Monte Carlo metodlari kullanmakta ve sürekli durum ortamlarında Q-değerlerininu ghesaplanması işin yeni bir teknik ortaya koymaktadır.cBütün yordamlar gerşek zamanlıdır ve güreceli olarak düşuk yer ve zaman karma-uu c o us üşıklıkları vardır. Yordamlar iyi bilinen Kısmen Güzlemlenebilir Markov Karar Süreşs o ucproblemleri uzerinde uygulanmıştır. Burada sürekli dağılımlar kullanıldığı işin değerü s u g gc gfonksiyonunun güsterimi daha zorlaştırılmıştır. Yordamlar Markov olmayan güzlemlerio s s oiş inanş durumları ile ilişkilendirerek saklı durumları ortaya şıkarabilmiş ve iş inanşc c s c s c cdurum uzayı uzerinde yaklaşık olarak en iyi bir davranış politikası oluşturabilmişlerdir.ü s s s s

Özet (Çeviri)

A real world environment is often partially observable for agents either becauseof noisy sensors or incomplete perception. Autonomous strategy planning under uncer-tainty has two major challenges. The first one is autonomous segmentation of the statespace for a given task, and the second, emerging complex behaviors, that deal with eachstate segment. This thesis proposes three new approaches, namely ARKAQ-Learning,KAFAQ-Learning and KBVI, that handle both challenges by utilizing combinations ofvarious techniques. ARKAQ makes use of ART2-A Networks augmented with KalmanFilters and Q-Learning. KAFAQ is a finite state automaton using Kalman filters andQ-Learning. KBVI uses Monte Carlo methods and introduces a new technique tocalculate Q-values for continuous domains.All are online algorithms with relatively low space and time complexity. Thealgorithms were run for some well-known Partially Observable Markov Decision Processproblems, where the problem of representing the value function is more difficult thanthe discrete case because inputs are continuous distributions. The algorithms couldreveal the hidden states, mapping non-Markovian observations to internal belief states,and also could construct an approximate optimal policy on the internal belief statespace.

Benzer Tezler

  1. Dinamik araç sistemli otonom kavşak yönetim stratejisi: Bir algoritma önerisi

    Autonomous interchange management strategy with dynamic vehicle system: An algorithm proposal

    RECEP BİLAL SIKAR

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    TrafikSakarya Üniversitesi

    İnşaat Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ HAKAN ASLAN

  2. Hybrid controller approach for an autonomous ground vehicle path tracking problem

    Otonom bir kara aracının yol takibi problemi için hibrit kontrolör yaklaşımı

    MERTCAN CİBOOĞLU

    Yüksek Lisans

    İngilizce

    İngilizce

    2016

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Kontrol ve Otomasyon Mühendisliği Ana Bilim Dalı

    PROF. DR. MEHMET TURAN SÖYLEMEZ

  3. Kentsel kayıp mekanların oluşmasında raylı sistem hattının etkileri: Bakırköy-Kazlıçeşme hattı üzerinden bir değerlendirme

    The effects of the rail system line on the formation of urban lost spaces: An evaluation on the Bakırköy-Kazlıçeşme line

    DERYANUR ŞİMŞEK

    Yüksek Lisans

    Türkçe

    Türkçe

    2022

    Mimarlıkİstanbul Teknik Üniversitesi

    Kentsel Tasarım Ana Bilim Dalı

    PROF. DR. HATİCE AYATAÇ

  4. Effects of cooperative vehicle dynamics on traffic flow control

    İşbirlikçi taşıt dinamiklerinin trafik akım denetimine etkileri

    MEHMET ALİ SİLGU

    Doktora

    İngilizce

    İngilizce

    2022

    Trafikİstanbul Teknik Üniversitesi

    İnşaat Mühendisliği Ana Bilim Dalı

    PROF. DR. HİLMİ BERK ÇELİKOĞLU

  5. Design, implementation and comparison ofsensor fusion methods for object detection and trackingbased on multiple 3D lidar sensors

    Çoklu 3D lidar sensörleri üzerindenesne algılama ve takibi için sensör füzyon yöntemlerinintasarımı, uygulaması ve karşılaştırılması

    ELİF AKSU TAŞDELEN

    Yüksek Lisans

    İngilizce

    İngilizce

    2020

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Kontrol ve Otomasyon Mühendisliği Ana Bilim Dalı

    DOÇ. DR. VOLKAN SEZER