Integration of machine learning and optimization models for data-driven decisions: Applications to lot sizing problem with random yield
Veri tabanlı karar alma için bütünleşik yapay öğrenme ve eniyileme modelleri: Olasılıksal üretim randımanı durumunda lot belirleme problemi uygulamaları
- Tez No: 928992
- Danışmanlar: PROF. DR. AHMET FİKRİ KARAESMEN
- Tez Türü: Doktora
- Konular: Endüstri ve Endüstri Mühendisliği, Industrial and Industrial Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2025
- Dil: İngilizce
- Üniversite: Koç Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Endüstri Mühendisliği ve Operasyon Yönetimi
- Bilim Dalı: Endüstri Mühendisliği Bilim Dalı
- Sayfa Sayısı: 173
Özet
Son yıllarda, veri toplama, analitik teknikler ve veri odaklı yöntemlerdeki önemli ilerlemeler, karmaşık karar alma ve üretim planlama zorluklarını ele alma biçimlerini dönüştürdü. Bu tez, bu yeniliklere dayanarak, çeşitli uygulamalarda belirsizliği ve değişkenliği yönetmek için yeni yaklaşımlar sunmaktadır. Bu araştırmanın temel odağı, makine öğrenimi tekniklerini, optimizasyon yöntemleriyle entegre ederek, belirsiz ortamlarda büyük verileri kullanarak karar vericiler için etkin karar alma kuralları türetmektir. Tez, üç temel çalışmayı kapsamaktadır: belirsizlik altındaki karar alma durumları, rassal randımanı olan üretim sistemleri için tek dönemli lot (parti) boyutlandırma ve son olarak çok dönemli lot boyutlandırma sorunu. İlk olarak, belirsiz bir olayı gözlemlemeden önce eylemlerle ilgili kararların verilmesi gereken ve yanlış kararların asimetrik maliyetlerle sonuçlandığı karar alma ve sınıflandırma problemi incelenmektedir. Özellikle sık görülen özelliklerin sonuçlar üzerinde önemli bir etkiye sahip olduğu senaryolarda, sınırlı gözlemlerden karar kuralları türetmek için makine öğrenimi ve optimizasyon tekniklerini entegre eden dört yeni yöntem önermekteyiz. Yöntemlerimiz, hem ikili hem de çok sınıflı sorunlarda yanlış kararlarla ilişkili maliyetleri en aza indirmeyi amaçlamaktadır. Kamuya açık veri kümelerini kullanan deneysel sonuçlar, yaklaşımlarımızın geleneksel kıyaslama ölçütlerinden önemli ölçüde daha iyi performans gösterdiğini ve maliyetleri \%95'e kadar azalttığını göstermektedir. İkinci olarak, rastgele verim (üretim randımanı) altında veri odaklı bir lot boyutlandırma sorununu araştırıyoruz. Yarı iletken üretimindeki randıman sorunlarında yola çıkarak, bir üretim sürecinin rastgele verim oranının lot boyutlandırma kararı verilmeden önce gözlemlenebilen çok sayıda özniteliğe (feature) bağlı olduğu duruma odaklanıyoruz. Benzer şekilde, talep de rastgele olabilir ve bir dizi özniteliğe bağlı olabilir. Bu ortamda en iyi lot belirleme kararı, randıman oranının sınırlı veri bulunan çok sayıda gözlemlenen özniteliğe bağlı olması nedeniyle zorlaşmaktadır. Bu zorluğun üstesinden gelmek için, makine öğreniminden araçları rassal optimizasyon yöntemleriyle birleştiren tahmin ve optimizasyon yöntemleri önerilmektedir. Yarı iletken verim verileri için kamuya açık bir veri kümesi ve ek bir sentetik veri kümesi kullanarak, farklı tahmin ve optimizasyon yaklaşımlarının performans karşılaştırması sunulmaktadır. Maliyet minimizasyonu için öznitelik bilgilerinin dikkate alınmasının önemli bir değeri olduğunu gösteriyoruz. Ayrıca, bu sorun için en etkin yöntemin, tahmin araçlarını rassal getirili envanter sorununun kuramsal optimizasyon özellikleriyle birleştirmek olduğunu göstermekteyiz. Son olarak, randıman belirsizliği olan tek dönemli lot boyutlandırma problemini, çok dönemli duruma genişletiyoruz. Dönemler arasındaki randıman oranındaki değişkenlik göz önüne alındığında, üretim ufkunun sonunda çok sayıda olası senaryo bulunmaktadır. Ana amaç, literatürdeki bilinen olasılık dağıtımları varsayan geleneksel yaklaşımların aksine, bilinmeyen getiri dağıtımları altında optimum lot boyutlarını belirlemek için veri odaklı yöntemler geliştirmektir. Bu yöntemler, son dönemin sonunda beklenen eksik ve fazla maliyetleri artı ara dönemlerin stok tutma ve değişken üretim maliyetini en aza indirmeyi ve toplam müşteri talebinin karşılanmasını sağlamayı amaçlamaktadır. Bu çalışma, rassal randıman oranı ve bilinmeyen olasılık dağılımları ile çok dönemli lot boyutlandırma sorununu ilk kez ele almak için pekiştirmeli öğrenme yöntemlerini de önermekte ve sınamaktadır. Yaklaşımımızın etkinliğini değerlendirmek için sonuçları yerleşik statik ve dinamik optimizasyon yöntemleriyle karşılaştırıyoruz. Yöntemimiz, rassal randıman oranlarına sahip üretim sistemlerinde karar alma için esnek ve uyarlanabilir bir çerçeve sunmaktadır.
Özet (Çeviri)
In recent years, significant advancements in data collection, analytical techniques, and data-driven methodologies have transformed the landscape of addressing complex decision-making and production planning challenges. Building on these innovations, this thesis introduces novel data-driven approaches to manage uncertainty and variability across diverse applications. The core focus of this research is to leverage big data in uncertain environments to derive effective decision-making rules for policymakers by integrating machine learning techniques with optimization methods. The thesis encompasses three primary studies: decision-making problems under uncertainty, a single-stage lot sizing problem, and a multi-period lot sizing problem with random yields. First, we address a challenge in decision-making and classification problems where actions must be taken prior to observing an uncertain event, and incorrect decisions result in asymmetric costs. We propose some novel methods that integrate machine learning and optimization techniques to derive decision rules from limited observations, particularly in scenarios where frequent features have a significant impact on outcomes. Our methods aim to minimize the costs associated with incorrect decisions in both binary and multi class classification problems. Experimental results using publicly available data sets show that our approaches significantly outperform traditional benchmarks, reducing costs by up to 95% with respect to naive benchmarks. Second, we investigate a data-driven lot sizing problem under random yield. Motivated by semi-conductor production, we focus on the case where the random yield rate of a manufacturing process depends on a large number of features that can be observed before the lot sizing decision is made. Similarly, demand may also be random and may depend on a number of features. The lot sizing problem in this setting is challenging because the optimal decision depends on a large number of observed features for which there is limited data. To address this challenge, we propose estimation and optimization methods that combine tools from machine learning with tools from stochastic optimization. Using a publicly available data set for semi-conductor yield data and an additional synthetic data set, we compare the performance of different estimation and optimization approaches. We show that there is significant value of taking feature information into account for cost minimization. We also find that the best method for this problem combines tools from estimation with theoretical optimization properties of the random yield inventory problem. Finally, we extend the single-period lot sizing problem to a multi-period setting. Given the realized variability in yields across periods, there are numerous potential scenarios by the end of the production horizon. The main objective is to develop a data-driven rule for determining optimal lot sizes under unknown yield distributions, unlike conventional approaches in the literature that assume known distributions. This rule aims to minimize the expected underage and overage costs at the end of the final period plus holding cost of intermediate periods and variable production cost while ensuring that total customer demand is met. This study advances the literature by introducing reinforcement learning to address the multi-period lot sizing problem with stochastic yields and unknown distribution for the first time. To assess the effectiveness of our approach, we compare results against established static and dynamic optimization methods. Our method provides a flexible and adaptive framework for decision-making in complex production systems characterized by stochastic yields.
Benzer Tezler
- Anomaly detection in ınternet of medical things using deep learning
Anomaly detect ionin internet of medical things using deep learning
AYŞE BETÜL BÜKEN
Yüksek Lisans
İngilizce
2025
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSakarya ÜniversitesiYazılım Mühendisliği Ana Bilim Dalı
PROF. DR. DEVRİM AKGÜN
- Veri güdümlü dijital ikiz modeli ile freze takım tezgahı takım aşınma tahminlemesi ve kesme parametreleri optimizasyonu
Prediction of tool wear and cutting parameter optimization of milling machine tool with data-driven digital twin model
GİZEM BURUN
Yüksek Lisans
Türkçe
2024
Endüstri ve Endüstri Mühendisliğiİstanbul Teknik ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
PROF. DR. ALP ÜSTÜNDAĞ
- Improvıng the predıctıon of oıl and gas productıon usıng artıfıcıal ıntellıgence algorıthms
Yapay zeka algoritmalarını kullanarak petrol ve gaz üretim tahminlerinin iyileştirilmesi
AZHAR NAJI MUHAJIR ALYAHYA
Yüksek Lisans
İngilizce
2025
EnerjiSakarya ÜniversitesiMühendislik Bilimleri Ana Bilim Dalı
PROF. DR. GÜLÜZAR ÇİT
- A scheme proposal for the development of machine learning-driven agent-based models through case studies
Makine öğrenmesi destekli etmen tabanlı modellerin geliştirilmesine yönelik bir plan önerisi: Örnek modeller
YAKUP TURGUT
Doktora
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ CAFER ERHAN BOZDAĞ
- Machine learning-driven optimization: Applications in retention management and rank aggregation
Makine öğrenmesi tabanlı optimizasyon: Tutundurma yönetimi ve sıralama toplulaştırma uygulamaları
AHMET ŞAHİN
Doktora
İngilizce
2024
Endüstri ve Endüstri MühendisliğiÖzyeğin ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ERİNÇ ALBEY