From data to action: Transforming pressure testing in manufacturing with machine learning for enhancing energy efficiency
Veriden aksiyona: Üretimdeki basınç testini makine öğrenimiyle dönüştürmek ve enerji verimliliğini artırmak
- Tez No: 885563
- Danışmanlar: DR. ÖĞR. ÜYESİ MUSTAFA BERKER YURTSEVEN
- Tez Türü: Yüksek Lisans
- Konular: Enerji, Energy
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2024
- Dil: İngilizce
- Üniversite: İstanbul Teknik Üniversitesi
- Enstitü: Lisansüstü Eğitim Enstitüsü
- Ana Bilim Dalı: Enerji Bilim ve Teknoloji Ana Bilim Dalı
- Bilim Dalı: Enerji Bilim ve Teknoloji Bilim Dalı
- Sayfa Sayısı: 87
Özet
Günümüzün rekabetçi piyasa koşullarında, enerji verimliliği yüksek tesislerde üretim yapmak, bir ürünün piyasada kendine sağlam bir yer edinebilmesi için kritik bir faktördür. Yüksek enerji maliyetleri, ürünlerin rekabet gücünü olumsuz etkilerken, verimsiz üretim ve test yöntemleri içeren ürünlerin pazarda başarılı olması oldukça zordur. Bu bağlamda, üretim tesislerinin çeşitli aşamalarında toplanan verilerin detaylıca analiz edilerek, ürün kalitesinden ödün vermeden enerji tüketiminin azaltılması ve maliyet tasarrufu sağlanması, endüstriyel tesislerin ve sanayi bölgelerinin ekonomik sürdürülebilirliği açısından büyük önem taşımaktadır. Enerji verimliliğini artırmak ve maliyetleri düşürmek artık kaçınılmaz bir zorunluluktur. Bu zorunluluk, özellikle enerji yoğun sektörlerde olmak üzere, endüstriyel alanlarda faaliyet gösteren tüm sektörlerin öncelikli hedeflerinden biri haline gelmiştir. Bu çerçevede, imalat tesislerinde toplanan verilerin anlamlandırılarak, hedeflenen parametre ile diğer parametreler arasındaki ilişkilerin makine öğrenmesi metodolojileriyle analiz edilmesi, üretim süreçlerinin verimliliğini artırmak açısından büyük avantajlar sunmaktadır. Endüstriyel üretimde enerji verimliliğini artırmak, sadece maliyetleri düşürmekle kalmaz, aynı zamanda işletmelerin çevresel sorumluluklarını yerine getirmelerine de katkı sağlar. Bu bağlamda, makine öğrenimi algoritmalarının kullanımı, üretim süreçlerindeki enerji tüketimini optimize ederek hem ekonomik hem de ekolojik sürdürülebilirliği destekler. Özellikle büyük veri setlerinin analizinde üstün performans gösteren bu algoritmalar, üretim hatalarının minimize edilmesi ve kaynakların daha etkin kullanılmasını sağlar. Bu sayede, endüstriyel tesisler rekabet avantajı kazanırken, aynı zamanda çevre dostu üretim tekniklerini benimseyerek karbon ayak izlerini azaltır. Bu yaklaşım, gelecekteki üretim stratejilerinin belirlenmesinde önemli bir rol oynayacak ve sanayinin daha yeşil ve sürdürülebilir bir yapıya dönüşmesine katkı sağlayacaktır. Bu tez çalışmasında da kullanılan makine öğrenimi ve veri analitiği, bu dönüşüm sürecinin önemli bir destekçisi olarak, endüstriyel operasyonların daha akıllı, verimli ve çevreye duyarlı bir şekilde yürütülmesine olanak tanır. Bu tez çalışması, üretim süreçlerinin verimliliğini artırma ve çevresel etkilerini azaltma hedefiyle, otomotiv sektöründe faaliyet gösteren bir tesiste bulunan basınç testinin optimizasyonuna odaklanmıştır. Basınç düşüş testleri hidrolik sistemlerde kullanılmak üzere üretilen parçalarda, ürünün güvenlik ve kalite bakımından uygunluğunun kontrolü amacı ile kullanılan bir test metodu olup, belirli bir başlangıç basıncı ile kapalı sistemde tutulan akışkanın zamanla basınç değişimini inceleyerek basınç düşüşü miktarından kaçak miktarını tahmin etmeye yarayan bir metoddur. Geleneksel basınç testi yöntemleri, yüksek enerji tüketimi ve uzun çevrim süreleri gerektirmesi gibi etkenler nedeniyle maliyet ve çevresel sürdürülebilirlik açısından endüstriyel işletmeler için önemli zorluklar oluşturmaktadır. Bu araştırma, makine öğrenimi algoritmalarının bu süreçleri optimize etmedeki etkinliğini ve kaçak tespitini geliştirmedeki potansiyelini gerçek bir üretim tesisisindeki veriler ile çalışmak sureti ile araştırmaktadır. Araştırma, bir üretim tesisinde bulunan, test makinalarının çok çeşitli sensör ölçüm kayıtlarını içeren, bir yılı aşkın süre ve 1,7 milyondan fazla tekil ve benzersiz kaydı içeren geniş bir veri seti üzerinde gerçekleştirilmiştir. Veri seti, test süreçlerinin dinamiklerini, kendi aralarındaki bağıntıları anlayarak korelasyon matrisi oluşturmak ve özellikle deney süresi düşürme odaklı potansiyel iyileştirme alanlarını anlamak için detaylıca analiz edilmiştir. Araştırma kapsamında, lineer ve lineer olmayan veriler için sıkça kullanılan makine öğrenimi algoritmalarından; Random Forest, XGBoost ve Doğrusal Regresyon kullanılarak basınç testlerinin optimum sürelerini tahmin etmek için bir model geliştirmiştir. Her bir algoritma, çapraz doğrulama teknikleri kullanılarak optimize edilmiştir. Veri seti rastsal olarak önce %75 eğitim ve %25 test olmak üzere iki gruba ayrılmıştır. Burada makine öğrenimi algoritmaları çalıştırılmış ve modellerin başarı oranları gerçek değerler ile modeller tarafından tahmin edilen değerler arasındaki farkın karelerinin toplamının karekökü esasına dayanan, kök ortalama kare hata (RMSE) ve R2 gibi istatiksel metodlarla incelenmiş ve karşılaştırılmıştır. Sonrasında doğrulama amacı ile oluşturulan modelde test ve eğitim veri setlerinin yüzdeleri yer değiştirilmiş ve oluşturulan modelin başarısı farklı bir veri setinde test edilmiştir. Bu doğrulama sonucu modelin çok yakın performans gösterdiği tespit edilse de, yine de bunun rastsal olmadığından bir kez daha emin olmak ve validasyonu tamamlamak amacı ile veri seti bu kez de üç gruba ayrılmıştır (eğitim, test, doğrulama). Bu kez %64 eğitim, %16 test ve %20 doğrulama olmak üzere üç farklı grupta modelin etkinliği ve başarısı aynı istatiksel göstergeler ile teyit edilmiştir. Sonuç olarak veri setinin homojenliğinden ve veri setinin genel yapısından modelin güvenilir ve tekrarlanabilir sonuçlar ürettiği görülmüştür. Bu çalışma, farklı veri setlerinde ve çeşitli dağılımlarda model performansını değerlendirmek için etkili bir metodoloji sağlar. Bu metodoloji, algoritmaların farklı veriler üzerinde nasıl performans gösterdiğini anlamada ve model hatalarını minimuma indirgemek sureti ile daha doğru tahminler yapılmasını sağlamada önemlidir. Random Forest algoritması, diğer modellere göre belirgin şekilde daha üstün performans sergilediğinden çalışma için model olarak seçilmiş ancak hiperparametre optimizasyonu ile bu başarı daha da arttırılmak istenmiştir. Hiperparametreler, modelin yapılandırılmasında kullanılan ayarlar veya parametrelerdir ve doğru bir şekilde ayarlanmaları, modelin en iyi performansı göstermesini sağlar. Hiperparametre optimizasyonu, bu hiperparametrelerin en iyi değerlerini bulmayı amaçlayan bir süreçtir ve deneme-yanılma yöntemleri veya daha değişik optimizasyon algoritmaları kullanılarak yapılır. Örneğin, Grid Search veya Random Search gibi fonksiyonlarla tüm parametre kombinasyonları denenir ve en iyi sonuç veren kombinasyon bulunur. Bu süreç, modelin performansını artırmanın yanı sıra aşırı uyumu önlemeye de yardımcı olabilir, çünkü uygun hiperparametreler seçilmediğinde, model verilere aşırı uyum sağlayabilir ve yeni verilerle genelleme yapma yeteneğini kaybedebilir. Dolayısıyla, Random Forest gibi modellerin başlangıçtaki performansı yüksek, ortalama kök hatası düşük olsa dahi, hiperparametre optimizasyonu tekniği ile bu performans daha da artırılabilir ve hata miktarı daha da düşürülebilir. Bu işlem, modelin daha farklı bir büyüklük ve tipteki bir veri setinde çalışabilme yetkinliği kazanmasına yardımcı olabilir. Bu tez, makine öğrenimi tekniklerinin endüstriyel uygulamalarda nasıl etkili bir şekilde kullanılabileceğini göstermenin yanında başka üretim tesislerinde bulunan benzer süreçlerin enerji verimliliğini arttırabilme potansiyeli bakımından bir model oluşturmayı da hedeflemiştir. Araştırma kapsamında, basınç testlerinin ideal süresini tahmin etmek için Random Forest, XGBoost ve Doğrusal Regresyon gibi makine öğrenimi algoritmalarını kullanarak bir model geliştirdi. Bu modeller, çapraz doğrulama teknikleriyle optimize edildi ve başarımı kök ortalama kare hata (RMSE) ve R2 gibi istatistiksel metriklerle değerlendirildi. Sonuçlar, Random Forest algoritmasının diğerlerine göre belirgin şekilde daha üstün performans sergilediğini ortaya koydu. Ancak, hiperparametre optimizasyonu teknikleri ile bu başarı bir miktar daha artırılarak, modelin verimliliği ve çevresel sürdürülebilirliği daha da iyileştirilmiş oldu. Araştırma, verimlilik ve sürdürülebilirlik hedeflerine ulaşmada makine öğreniminin oynayabileceği önemli bir rolü ortaya koymaktadır. Ayrıca, makine öğrenimi modellerinin enerji ve süreç optimizasyonu yaklaşımlarını nasıl etkileyebileceğine dair geniş kapsamlı bir perspektif sunarak, üretim süreçlerindeki geleneksel enerji tüketim kabulleri üzerinde dönüştürücü bir etki yaratma potansiyeline sahiptir. Sürdürülebilirlik ve enerji bilim teknolojisi perspektifleri bu araştırmanın ana hatlarını belirlerken, bu tez aynı zamanda maliyet tasarrufu, enerji verimliliği ve çevre dostu üretim uygulamalarına yönelik küresel sürdürülebilirlik hedefleriyle uyum içindeki yenilikçi çözümler geliştirme çabalarına da katkı sunmaya odaklanmıştır.
Özet (Çeviri)
In today's competitive market, manufacturing in energy-efficient facilities is crucial for a product's success. High energy costs can severely impact product competitiveness, making it challenging for inefficiently produced goods. By carefully evaluating data collected throughout the production process, it's possible to reduce energy consumption without sacrificing product quality, thus achieving cost savings, and ensuring the economic and environmental sustainability of industrial operations. Using machine learning methodologies, which are excellent at analyzing large data sets, can significantly enhance process efficiency. Optimizing energy use through these algorithms not only cuts costs but also reduces environmental impact. Machine learning usage is beneficial at minimizing production errors and utilizing resources more effectively, helping industrial facilities gain a competitiveness while implementing eco-friendly solutions. This approach supports the transition to greener, more sustainable industrial activities, for smarter, more efficient, and environmentally operations. This study investigates the use of machine learning techniques to enhance the efficiency of pressure drop tests, which are conducted at different stages of production processes to measure the accuracy of the product or process. Traditional pressure testing methods pose significant challenges for industrial enterprises in terms of cost and environmental impact due to their high energy consumption and lengthy durations. These tests are also used for leakage detection to ensure product safety and structural integrity. This thesis examines the applicability and effectiveness of advanced machine learning algorithms to optimize pressure testing processes and enhance the energy efficiency and decrease the cycle times. Over the course of more than a year, a large dataset containing 1.7 million test records was utilized from a production plant testbenches. Data firstly classified and merged based on standardized data analysis systematics. Afterwards, the data was used to deeply analyze the dynamics of the test processes, its internal correlations regard to paramaters and identify potential areas for improvement especially focused on duration decrease of tests for efficiency reasons. The study developed a model using various machine learning algorithms such as Random Forest Regressor, XGBoost, and Linear Regression to predict the optimum duration of pressure drop tests. Each algorithm has been optimized using cross-validation techniques. The dataset was randomly divided into two groups, 75% for training and 25% for testing. Here, machine learning algorithms were executed, and the performance of the models was examined and compared using statistical indicators based on the root of the sum of the squares of the differences between the actual values and the values predicted by the models, such as Root Mean Square Error (RMSE) and R-squared (R2). Subsequently, the split of the test and training datasets were swapped in the model for cross-validation purposes, and the performance of the model was tested for different random splits. Although cross-validation caused the model to get results very close, to ensure once more that this was not random and to complete the validation, the dataset was divided into three groups (train, test, validation). This time, the effectiveness and success of the model in three different groups, 64% training, 16% testing, and 20% validation, were confirmed using the same statistical indicators. As a result, it has been observed that the model produces reliable and reproducible results due to the homogeneity of the dataset and the general structure of the dataset. This study provides an effective methodology for assessing model performance on different datasets and various distributions. This methodology is important in understanding how algorithms perform on different data and in making more accurate predictions by minimizing model errors. The Random Forest algorithm was chosen for this study due to its better performance and lower error compared to other models. The next step was to further enhance this efficacy through hyperparameter tuning. Hyperparameters are adjustable settings that configure the model, and when tuned correctly, they optimize performance. The optimization process, which includes trial-and-error and techniques like Grid Search or Random Search, helps identify the best parameter combinations. This approach both increases performance and prevents overfitting by ensuring the model does not overly conform to the training data. This ensures in future, its ability to be generalized for other datasets. Consequently, while Random Forest performs well initially, leveraging hyperparameter optimization refines its performance, equipping it to handle broader datasets more effectively. Building on this, the thesis demonstrates effective use of machine learning in industrial applications, particularly in developing a model for predicting the optimal duration of pressure tests using algorithms such as Random Forest, XGBoost, and Linear Regression. These models were refined through cross-validation techniques, achieving low Root Mean Square Error (RMSE) and high R-squared (R2) values, indicating robust performance. Notably, Random Forest consistently outperformed other algorithms. Further enhancements were made by optimizing hyperparameters, which is slightly improved the model's efficiency and indirectly also its sustainability. This study highlights the crucial role that machine learning plays in advancing efficiency and sustainability objectives within the industrial sector.
Benzer Tezler
- Dünya genelinde yabancı yatırım akışının kirlilik sığınağı ve kirlilik hale hipotezi kapsamında incelenmesi: Dinamik panel veri analizi
Examination of foreign investments flows worldwide within the scope of pollution haven and pollution halo hypothesis: Dynamic panel data analysis
MERVE NUR ÜNAL
Yüksek Lisans
Türkçe
2022
EkonomiGalatasaray Üniversitesiİktisat Ana Bilim Dalı
DOÇ. DR. ZÜBEYDE SEVGİ İNECİ
PROF. DR. ALİ TARKAN ÇAVUŞOĞLU
- Tracing the contemporary critique in design: Mapping users' critical acts on social media
Tasarımda çağdaş eleştirinin izini sürme: Sosyal medyadaki kullanıcıların eleştirel eylemlerinin haritalandırılması
SELİN ARKAN
Doktora
İngilizce
2024
Endüstri Ürünleri Tasarımıİstanbul Teknik ÜniversitesiEndüstriyel Tasarım Ana Bilim Dalı
PROF. DR. ŞEBNEM TİMUR
- Developing resilient construction project professionals:examining architecture students' personality perspective
Dayanıklı yapım projesi profesyonellerinin geliştirilmesi:mimarlık öğrencilerinin kişilik bakış açısının incelenmesi
ALİME ŞANLI
Yüksek Lisans
İngilizce
2021
Mimarlıkİstanbul Teknik ÜniversitesiMimarlık Ana Bilim Dalı
DOÇ. DR. FATMA PINAR ÇAKMAK
- Siyasalın gündelik kuruluşu bağlamında sokak siyaseti
Street politics in context of everyday construction of political
FUNDA ÇOBAN
Doktora
Türkçe
2013
Siyasal BilimlerAnkara ÜniversitesiSiyaset Bilimi ve Kamu Yönetimi Ana Bilim Dalı
DOÇ. DR. ALEV ÖZKAZANÇ KOZAKLI
- Afet kriz yönetimine coğrafi bilgi teknolojilerinin katkısı ve hayat kurtaran büfe önerisi
Geographical information technology contribution to disaster crisis management and life saving kiosk proposal
AYŞE GİZ GÜLNERMAN
Yüksek Lisans
Türkçe
2014
Jeodezi ve Fotogrametriİstanbul Teknik ÜniversitesiGeomatik Mühendisliği Ana Bilim Dalı
DOÇ. DR. ÇİĞDEM GÖKSEL