A heuristic solution approach for dynamic mission abort problem based on deep reinforcement learning
Görev iptal problemi için derin pekiştirmeli öğrenmeye dayalı bir sezgisel çözüm yaklaşımı
- Tez No: 912062
- Danışmanlar: PROF. DR. ZEYNEP PELİN BAYINDIR, DOÇ. DR. ENGİN TOPAN
- Tez Türü: Yüksek Lisans
- Konular: Endüstri ve Endüstri Mühendisliği, Industrial and Industrial Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2024
- Dil: İngilizce
- Üniversite: Orta Doğu Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Endüstri Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 181
Özet
Bu tez, Görev İptal Problemini Aktör-Eleştirmen çerçevesinde Derin Pekiştirmeli Öğrenme (DPÖ) kullanarak incelemekte ve yüksek boyutlu Markov Karar Süreçlerinin (MKS) çözümünde geleneksel stokastik yöntemlerden belirgin bir ayrışmayı temsil etmektedir. Çalışmada, eğitim verimliliğini artırmak amacıyla yönerge temelli bir desen stratejisinin uygulanması, onarım kısıtlarını sağlamak için eylem maskelemenin kullanılması ve sistem bozulmasını modellemek ve durumları ayrıklaştırmak üzere De Jonge tarafından önerilen Gamma Sürecinin entegrasyonu gibi yenilikçi teknikler sunulmaktadır. Ayrıca, klasik dinamik programlama ile yapılan karşılaştırmalı analiz, DPÖ yaklaşımının görev açısından kritik ortamlarda karmaşık karar verme sorunlarını çözme konusundaki yetkinliğini vurgulamaktadır.
Özet (Çeviri)
This thesis examines the Mission Abort Problem using Deep Reinforcement Learning (DRL) within an Actor-Critic framework, marking a significant departure from traditional stochastic methods for solving high-dimensional Markov Decision Processes (MDPs). The study introduces innovative techniques, such as an instructive pattern strategy to enhance training efficiency, action masking to enforce repair constraints, and the incorporation of the Gamma Process proposed by De Jonge to model system degradation and discretize states. A comparative analysis with classical dynamic programming underscores the capability of DRL to tackle complex decision-making challenges in mission-critical environments.
Benzer Tezler
- Detection of malicious web pages
Zararlı web sayfalarının tespiti
EMRE SÜREN
Yüksek Lisans
İngilizce
2014
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik ÜniversitesiBilişim Sistemleri Ana Bilim Dalı
DOÇ. DR. SEVGİ ÖZKAN YILDIRIM
- Özdeş paralel makinelerde toplam gecikmeyi enküçüklemek amaçlı çizelgeleme problemi için sezgisel bir çözüm yaklaşımı
A heuristic solution approach for identical parallel machine scheduling problem with minimum total tardiness
GÜLCAN GOCUKLU
Yüksek Lisans
Türkçe
2011
Endüstri ve Endüstri MühendisliğiEskişehir Osmangazi ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
PROF. DR. MÜJGAN SAĞIR
- Bulanık çok modlu kaynak kısıtlı proje çizelgeleme problemlerinin çözümü için matematiksel bir model
A mathematical model for the solution of the fuzzy multi mode resource-constrained project scheduling problems
ÖMER ATLI
Doktora
Türkçe
2012
Endüstri ve Endüstri MühendisliğiHava Harp Okulu KomutanlığıEndüstri Mühendisliği Ana Bilim Dalı
PROF. DR. CENGİZ KAHRAMAN
- Paralel makineli sıra bağımlı hazırlık süreli çok kademeli makine çizelgeleme problemlerinin çözümü için kümeleme tabanlı ve sınırlı sayımlama temelli bir çözüm yaklaşımı
A clustering and restricted enumeration based solution approach for scheduling multi-stage parallel machines with sequence dependent setup times
HACER DEFNE OKUL
Yüksek Lisans
Türkçe
2015
Endüstri ve Endüstri MühendisliğiEskişehir Osmangazi ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
PROF. DR. MÜJGAN SAĞIR
- Column generation approach for dynamic berth allocation problem
Dinamik rıhtım tahsis etme problemi için kolon üretme yöntemi
ÖZGE NARİN
Yüksek Lisans
İngilizce
2010
Endüstri ve Endüstri MühendisliğiKoç ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
DOÇ. DR. CEYDA OĞUZ