Markov decision processes with restricted observations
Kasıtlı gözlem altında Markov karar süreçleri
- Tez No: 23440
- Danışmanlar: YRD. DOÇ. DR. YASEMİN SERİN
- Tez Türü: Yüksek Lisans
- Konular: Endüstri ve Endüstri Mühendisliği, Industrial and Industrial Engineering
- Anahtar Kelimeler: Kısıt Altında Makov Karar Süreçleri, Geçerli Yönler Metodu, Markov Decision Process under Constraints, Method of Feasible Directions
- Yıl: 1992
- Dil: İngilizce
- Üniversite: Orta Doğu Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Belirtilmemiş.
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 98
Özet
öz KISITLI GÖZLEM ALTINDA MARKOV KARAR SÜREÇLERİ AVŞAR, Zeynep Müge Yüksek Lisans Tezi, Endüstri Mühendisliği Anabilim Dalı Tez Yöneticisi: Y. Doç. Dr. Yasemin Serin Eylül, 1992, öd sayfa. Bu tezde, Markov Karar Süreçleri, kısıtlı gözlenebilirlik altında incelenmiş ve sonlu planlama süreleri için iskonto edilmiş toplam beklenen maliyeti enazlayan politikalar bulmak üzere algoritmalar geliştirilmiştir. Sistem zamana bağlı ve zamandan bağımsız politikalar olmak üzere iki durum için modellenmistir. Varolan metotların bir takım fiziksel gözlem sorunları olan stokastik sistemlere yaklaşımları yapılması gerekli hesaplamalar bazında karşılaştırıldığında, önerilen metotlar gelişme sağlamıştır. Maliyet fonksiyonu üzerinde bir sınır geliştirilmiş ve detaylı gözlem yapma üzerine kurulu bir prosedür sunulmuştur. Kullanılan yaklaşıma Markov Karar Süreçleri için bir durum indirgeme metodu olarak bakılabilir.
Özet (Çeviri)
ABSTRACT MARKOV DECISION PROCESSES WITH RESTRICTED OBSERVATIONS AVŞAR, Zeynep Müge M. S. in Industrial Engineering Supervisor : Assist Prof. Dr. Yasemin Serin September, 1992, dd pages In this study, Markov Decision Processes, are analyzed under unobservability constraints and algorithms are developed to find the optimal policies with respect to the objective of minimizing the expected total discounted cost over finite planning horizon. Models are constructed for the nonstationary and stationary policies. Compared to the easting approaches to similar stochastic systems, the proposed algorithms are computationally appealing. This approach can also be considered as a state reduction method for large scale Markov Decision Processes. A bound on cost function is developed and the concept of“refining observations”is introduced.
Benzer Tezler
- Equity portfolio optimization using reinforcement learning: An emerging market case
Pekiştirmeli öğrenme ile hisse senedi portföyü optimizasyonu: Gelişmekte olan piyasa örneği
MERT CANDAR
Yüksek Lisans
İngilizce
2022
Endüstri ve Endüstri Mühendisliğiİstanbul Teknik ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
PROF. DR. ALP ÜSTÜNDAĞ
- Rondomized control limit policies for markov decision processes with linear constraints
Doğrusal kısıtlar altındaki markov karar süreçleri için rassal kontrol limit politikaları
NİHAN FİDAN
Yüksek Lisans
İngilizce
2000
Endüstri ve Endüstri MühendisliğiOrta Doğu Teknik ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
DOÇ. DR. YASEMİN SERİN
- Modeling and optimizing resource allocation decisions through multi-model Markov decision processes with capacity constraints
Kaynak dağıtımı kararlarının kapasite kısıtlı çok modelli Markov karar süreçleri ile modellenmesi ve eniyilenmesi
ONUR DEMİRAY
Yüksek Lisans
İngilizce
2020
Endüstri ve Endüstri MühendisliğiKoç ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
PROF. DR. EGEMEN LERZAN ÖRMECİ ALİOĞLU
DOÇ. DR. EVRİM DİDEM GÜNEŞ ERÇETİN
- Markov decision processes and an application
Markov karar süreçleri ve uygulama
UMAY ZEYNEP UZUNOĞLU
Yüksek Lisans
İngilizce
2001
İstatistikDokuz Eylül Üniversitesiİstatistik Ana Bilim Dalı
PROF. DR. NİLGÜN MORALI