Deep Q-Learning approaches for stochastic dynamic optimization problems
Stokastik dinamik optimizasyon problemleri için Derin Q-Öğrenme yaklaşımları
- Tez No: 895440
- Danışmanlar: PROF. DR. ONUR KAYA
- Tez Türü: Doktora
- Konular: Endüstri ve Endüstri Mühendisliği, Industrial and Industrial Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2024
- Dil: İngilizce
- Üniversite: Eskişehir Teknik Üniversitesi
- Enstitü: Lisansüstü Eğitim Enstitüsü
- Ana Bilim Dalı: Endüstri Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 119
Özet
Bu tezde, yüksek boyutlu iki farklı optimizasyon probleminin derin pekiştirmeli öğrenme algoritmaları ile çözümüne odaklanılmıştır. Ele alınan ilk problem, raf ömrü kısa ürünlerin dinamik fiyatlandırma ve stok kontrol problemi, ikincisi ise sınırlı kapasiteli kuyruğa sahip tek makinalı bir üretim sisteminde kabul kontrol ve çizelgeleme problemidir. Her iki problem de stokastik bir ortamda dinamik kararlar almayı gerektirmektedir. İlk problemde ürünün raf ömründeki ve ikinci problemde heterojen iş sınıfı sayısındaki artış, problem boyutunu üssel olarak arttırmaktadır. Stokastik bir ortamda durum uzayı boyutu yüksek bir problemin çözümü yaklaşık yöntemler gerektirmektedir. Bu çalışmada, benzer çözüm zorluklarına sahip iki farklı problem, kesikli karar uzaylarında derin Q öğrenme (DQL) algoritması ile çözülmektedir. Problemlere özgü değişiklikler içeren ve pDQL olarak isimlendirilen bir çözüm yaklaşımı önerilmektedir. Önerilen yaklaşım, ilk problem için stokastik çevre karşısında dayanıklı çözümler üretmektedir. İkinci problemde ise algoritmanın yapısından kaynaklanan pozitif yanlılığı önlemeye destek olmaktadır. Sonuç olarak, önerilen yaklaşım, DQL algoritmasına kıyasla daha kısa sürede daha iyi sonuçlar bulabilmektedir. pDQL, ayrıca dinamik programlama (DP) algoritması ve çeşitli sezgisel yaklaşımlar ile karşılaştırılmaktadır. İlk problemde, pDQL algoritması tarafından bulunan sonuçlar DP sonuçlarına ortalama %96.7 yakın ve DQL algoritmasından %8.9 daha iyidir. İkinci problem için, pDQL algoritması DP sonuçlarına ortalama %94.8 yakın ve DQL algoritmasından ortalama %2.9 daha iyidir.
Özet (Çeviri)
In this thesis, two different high-dimensional optimization problems, dynamic pricing and inventory control of perishable products and admission control and scheduling problems, are solved using deep reinforcement learning algorithms. Both problems require dynamic decision making in a stochastic environment. The increasing shelf life of the product in the first problem and the increasing number of heterogeneous job classes in the second problem increase the problem size exponentially. Solving a high-dimensional problem in a stochastic environment requires approximation methods. The Deep Q Learning (DQL) algorithm is used in this study to solve these problems. A solution approach, called pDQL, is proposed with problem-specific modifications. For the first problem, pDQL produces robust solutions in the face of a stochastic environment. For the second problem, it helps to avoid the positive bias due to the structure of the DQL algorithm. As a result, the proposed approach is able to find better results in less time compared to the DQL algorithm. pDQL is also compared to the Dynamic Programming (DP) algorithm and various heuristic approaches. In the first problem, the results found by the pDQL algorithm are on average 96.7% closer to the DP results, and 8.9% better than the DQL algorithm. For the second problem, the pDQL algorithm is on average 94.8% closer to the DP results and on average 2.9% better than the DQL algorithm.
Benzer Tezler
- A deep reinforcement learning modelling approach for (s, S) inventory control problem
Envanter yönetimi için derin takviyeli öğrenme yaklaşımı
GÜRAY KILINÇ
Yüksek Lisans
İngilizce
2020
Endüstri ve Endüstri MühendisliğiYaşar ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
DOÇ. DR. BANU YETKİN EKREN
- Güç sistemlerinin yük tahmini analizinde uzun kısa süreli bellek metodunun kullanılması ve uygulaması
Load forecasting analysis of power systems using long short-term memory and applicati̇on
ÜMMÜHAN GÜLSÜM KILIÇ
Yüksek Lisans
Türkçe
2021
Elektrik ve Elektronik MühendisliğiBilecik Şeyh Edebali ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
PROF. DR. MEHMET KURBAN
DOÇ. DR. EMRAH DOKUR
- Zaman serileri tahmininde melez bir yaklaşım
A hybrid approach to time series forecasting
NURBANU IŞIK DELİBALTA
Yüksek Lisans
Türkçe
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolFatih Sultan Mehmet Vakıf ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. BURHANETTİN CAN
DR. ÖĞR. ÜYESİ GÖNÜL ULUDAĞ
- Automatic disc herniation diagnosis with machine learning methods from MRI images
MRI görüntülerinden makine öğrenme yöntemleriyle otomatik disk fıtığı tanısı
MERVE APAYDIN YUMUŞ
Yüksek Lisans
İngilizce
2024
Elektrik ve Elektronik MühendisliğiAnkara Yıldırım Beyazıt ÜniversitesiElektrik ve Elektronik Mühendisliği Ana Bilim Dalı
PROF. DR. ÖMER KARAL
- Gerçek zamanlı endüstriyel kontrol sistemleri için makine öğrenmesi temelli yaklaşımlar
Machine learning approaches for real-time industrial control systems
SÜLEYMAN MANTAR
Doktora
Türkçe
2024
Elektrik ve Elektronik MühendisliğiBursa Uludağ ÜniversitesiElektronik Mühendisliği Ana Bilim Dalı
DOÇ. DR. ERSEN YILMAZ