Autonomous strategy planning under uncertainty

Belirsizlik altında özerk strateji geliştirme

PDF İndir

Tez No: 181311
Yazar: ALP SARDAĞ
Danışmanlar: PROF. DR. HÜSEYİN LEVENT AKIN
Tez Türü: Doktora
Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
Anahtar Kelimeler: Belirtilmemiş.
Yıl: 2006
Dil: İngilizce
Üniversite: Boğaziçi Üniversitesi
Enstitü: Fen Bilimleri Enstitüsü
Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
Bilim Dalı: Belirtilmemiş.
Sayfa Sayısı: 151

Özet

Gerşek dünya, bu ortamdaki etmenler tarafından gürültülü algılayıcılar ya dac u u u uueksik algı nedeniyle kısmi olarak güzlemlenebilir. Belirsizlik altında üzerk stratejio ogeliştirmenin karşısında iki büyük engel vardır. Verilen bir gürev işin sürekli du-s s uu o c urum uzayının üzerk olarak bülgelere ayrılmasıve bu bülgeler uzerinde amaca yüneliko o o ü oügkarmaşık davranışların ortaya şıkarılması. Bu tezde isimleri ARKAQ-Oğrenme, KAFAQ-s s cügOğrenme ve KBVI olan ve şeşitli tekniklerin bir araya getirilmesinden oluşan uş yenics s ücügyaklaşım ünerilmektedir. ARKAQ-Oğrenme yapısında Kalman ï¬ltreleme üzelliği ek-so o güg üglenmiş, ART2-A ağı ve Q-Oğrenme metodları kullanılmıştır. KAFAQ-Oğrenme, Kalmans g sügï¬ltreleme ve Q-Oğrenme yüntemlerini kullanan bir sonlu durum makinasıdır. KBVIoise Monte Carlo metodlari kullanmakta ve sürekli durum ortamlarında Q-değerlerininu ghesaplanması işin yeni bir teknik ortaya koymaktadır.cBütün yordamlar gerşek zamanlıdır ve güreceli olarak düşuk yer ve zaman karma-uu c o us üşıklıkları vardır. Yordamlar iyi bilinen Kısmen Güzlemlenebilir Markov Karar Süreşs o ucproblemleri uzerinde uygulanmıştır. Burada sürekli dağılımlar kullanıldığı işin değerü s u g gc gfonksiyonunun güsterimi daha zorlaştırılmıştır. Yordamlar Markov olmayan güzlemlerio s s oiş inanş durumları ile ilişkilendirerek saklı durumları ortaya şıkarabilmiş ve iş inanşc c s c s c cdurum uzayı uzerinde yaklaşık olarak en iyi bir davranış politikası oluşturabilmişlerdir.ü s s s s

Özet (Çeviri)

A real world environment is often partially observable for agents either becauseof noisy sensors or incomplete perception. Autonomous strategy planning under uncer-tainty has two major challenges. The ï¬rst one is autonomous segmentation of the statespace for a given task, and the second, emerging complex behaviors, that deal with eachstate segment. This thesis proposes three new approaches, namely ARKAQ-Learning,KAFAQ-Learning and KBVI, that handle both challenges by utilizing combinations ofvarious techniques. ARKAQ makes use of ART2-A Networks augmented with KalmanFilters and Q-Learning. KAFAQ is a ï¬nite state automaton using Kalman ï¬lters andQ-Learning. KBVI uses Monte Carlo methods and introduces a new technique tocalculate Q-values for continuous domains.All are online algorithms with relatively low space and time complexity. Thealgorithms were run for some well-known Partially Observable Markov Decision Processproblems, where the problem of representing the value function is more diï¬cult thanthe discrete case because inputs are continuous distributions. The algorithms couldreveal the hidden states, mapping non-Markovian observations to internal belief states,and also could construct an approximate optimal policy on the internal belief statespace.

Benzer Tezler

Tez No
940845
Açık deniz römorkör ve destek gemileri işletmeciliğinin stratejikyönetim modellemesi
Strategic management modeling for offshore tugboat and supportvessel operations
ALİ BURÇİN EKE
Doktora
Türkçe
2025
Denizcilik İstanbul Teknik Üniversitesi
Deniz Ulaştırma Mühendisliği Ana Bilim Dalı
PROF. DR. ÖZCAN ARSLAN
Tez No
814051
Dinamik araç sistemli otonom kavşak yönetim stratejisi: Bir algoritma önerisi
Autonomous interchange management strategy with dynamic vehicle system: An algorithm proposal
RECEP BİLAL SIKAR
Yüksek Lisans
Türkçe
2023
Trafik Sakarya Üniversitesi
İnşaat Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ HAKAN ASLAN
Tez No
450992
Hybrid controller approach for an autonomous ground vehicle path tracking problem
Otonom bir kara aracının yol takibi problemi için hibrit kontrolör yaklaşımı
MERTCAN CİBOOĞLU
Yüksek Lisans
İngilizce
2016
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol İstanbul Teknik Üniversitesi
Kontrol ve Otomasyon Mühendisliği Ana Bilim Dalı
PROF. DR. MEHMET TURAN SÖYLEMEZ
Tez No
948236
Vision-based detection and recognition of maritime objects for autonomous surface navigation
Otonom deniz seyrüseferi için görüntü tabanlı engel tespiti ve gemi sınıflandırma
SEVDA SAYAN YONCA
Yüksek Lisans
İngilizce
2025
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol İstanbul Teknik Üniversitesi
Bilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. HAZIM KEMAL EKENEL
Tez No
952608
Strategıc operatıons research for the mıssıons of unmanned aerıal vehıcles
İnsansız hava araçları operasyonları için stratejik harekat araştırması
MURAT ATALAY
Doktora
İngilizce
2025
Endüstri ve Endüstri Mühendisliği Hacettepe Üniversitesi
Endüstri Mühendisliği Ana Bilim Dalı
PROF. DR. MURAT CANER TESTİK

Geri Dön