Geri Dön

Deep Q-Learning approaches for stochastic dynamic optimization problems

Stokastik dinamik optimizasyon problemleri için Derin Q-Öğrenme yaklaşımları

  1. Tez No: 895440
  2. Yazar: TUĞÇE YAVUZ
  3. Danışmanlar: PROF. DR. ONUR KAYA
  4. Tez Türü: Doktora
  5. Konular: Endüstri ve Endüstri Mühendisliği, Industrial and Industrial Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2024
  8. Dil: İngilizce
  9. Üniversite: Eskişehir Teknik Üniversitesi
  10. Enstitü: Lisansüstü Eğitim Enstitüsü
  11. Ana Bilim Dalı: Endüstri Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 119

Özet

Bu tezde, yüksek boyutlu iki farklı optimizasyon probleminin derin pekiştirmeli öğrenme algoritmaları ile çözümüne odaklanılmıştır. Ele alınan ilk problem, raf ömrü kısa ürünlerin dinamik fiyatlandırma ve stok kontrol problemi, ikincisi ise sınırlı kapasiteli kuyruğa sahip tek makinalı bir üretim sisteminde kabul kontrol ve çizelgeleme problemidir. Her iki problem de stokastik bir ortamda dinamik kararlar almayı gerektirmektedir. İlk problemde ürünün raf ömründeki ve ikinci problemde heterojen iş sınıfı sayısındaki artış, problem boyutunu üssel olarak arttırmaktadır. Stokastik bir ortamda durum uzayı boyutu yüksek bir problemin çözümü yaklaşık yöntemler gerektirmektedir. Bu çalışmada, benzer çözüm zorluklarına sahip iki farklı problem, kesikli karar uzaylarında derin Q öğrenme (DQL) algoritması ile çözülmektedir. Problemlere özgü değişiklikler içeren ve pDQL olarak isimlendirilen bir çözüm yaklaşımı önerilmektedir. Önerilen yaklaşım, ilk problem için stokastik çevre karşısında dayanıklı çözümler üretmektedir. İkinci problemde ise algoritmanın yapısından kaynaklanan pozitif yanlılığı önlemeye destek olmaktadır. Sonuç olarak, önerilen yaklaşım, DQL algoritmasına kıyasla daha kısa sürede daha iyi sonuçlar bulabilmektedir. pDQL, ayrıca dinamik programlama (DP) algoritması ve çeşitli sezgisel yaklaşımlar ile karşılaştırılmaktadır. İlk problemde, pDQL algoritması tarafından bulunan sonuçlar DP sonuçlarına ortalama %96.7 yakın ve DQL algoritmasından %8.9 daha iyidir. İkinci problem için, pDQL algoritması DP sonuçlarına ortalama %94.8 yakın ve DQL algoritmasından ortalama %2.9 daha iyidir.

Özet (Çeviri)

In this thesis, two different high-dimensional optimization problems, dynamic pricing and inventory control of perishable products and admission control and scheduling problems, are solved using deep reinforcement learning algorithms. Both problems require dynamic decision making in a stochastic environment. The increasing shelf life of the product in the first problem and the increasing number of heterogeneous job classes in the second problem increase the problem size exponentially. Solving a high-dimensional problem in a stochastic environment requires approximation methods. The Deep Q Learning (DQL) algorithm is used in this study to solve these problems. A solution approach, called pDQL, is proposed with problem-specific modifications. For the first problem, pDQL produces robust solutions in the face of a stochastic environment. For the second problem, it helps to avoid the positive bias due to the structure of the DQL algorithm. As a result, the proposed approach is able to find better results in less time compared to the DQL algorithm. pDQL is also compared to the Dynamic Programming (DP) algorithm and various heuristic approaches. In the first problem, the results found by the pDQL algorithm are on average 96.7% closer to the DP results, and 8.9% better than the DQL algorithm. For the second problem, the pDQL algorithm is on average 94.8% closer to the DP results and on average 2.9% better than the DQL algorithm.

Benzer Tezler

  1. A deep reinforcement learning modelling approach for (s, S) inventory control problem

    Envanter yönetimi için derin takviyeli öğrenme yaklaşımı

    GÜRAY KILINÇ

    Yüksek Lisans

    İngilizce

    İngilizce

    2020

    Endüstri ve Endüstri MühendisliğiYaşar Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    DOÇ. DR. BANU YETKİN EKREN

  2. Güç sistemlerinin yük tahmini analizinde uzun kısa süreli bellek metodunun kullanılması ve uygulaması

    Load forecasting analysis of power systems using long short-term memory and applicati̇on

    ÜMMÜHAN GÜLSÜM KILIÇ

    Yüksek Lisans

    Türkçe

    Türkçe

    2021

    Elektrik ve Elektronik MühendisliğiBilecik Şeyh Edebali Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    PROF. DR. MEHMET KURBAN

    DOÇ. DR. EMRAH DOKUR

  3. Zaman serileri tahmininde melez bir yaklaşım

    A hybrid approach to time series forecasting

    NURBANU IŞIK DELİBALTA

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolFatih Sultan Mehmet Vakıf Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. BURHANETTİN CAN

    DR. ÖĞR. ÜYESİ GÖNÜL ULUDAĞ

  4. Automatic disc herniation diagnosis with machine learning methods from MRI images

    MRI görüntülerinden makine öğrenme yöntemleriyle otomatik disk fıtığı tanısı

    MERVE APAYDIN YUMUŞ

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Elektrik ve Elektronik MühendisliğiAnkara Yıldırım Beyazıt Üniversitesi

    Elektrik ve Elektronik Mühendisliği Ana Bilim Dalı

    PROF. DR. ÖMER KARAL

  5. Gerçek zamanlı endüstriyel kontrol sistemleri için makine öğrenmesi temelli yaklaşımlar

    Machine learning approaches for real-time industrial control systems

    SÜLEYMAN MANTAR

    Doktora

    Türkçe

    Türkçe

    2024

    Elektrik ve Elektronik MühendisliğiBursa Uludağ Üniversitesi

    Elektronik Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ERSEN YILMAZ