Development of data-drıven models for estımatıng mud and fıltrate alkalınıty usıng machıne learnıng applıcatıons
Makine öğrenimi uygulamaları kullanarak çamur ve filtrat alkalinitesini tahmin etmek için veri odaklı modellerin geliştirilmesi
- Tez No: 945192
- Danışmanlar: DR. ÖĞR. ÜYESİ İHSAN BURAK KULGA, DR. SERCAN GÜL
- Tez Türü: Yüksek Lisans
- Konular: Petrol ve Doğal Gaz Mühendisliği, Petroleum and Natural Gas Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2025
- Dil: İngilizce
- Üniversite: İstanbul Teknik Üniversitesi
- Enstitü: Lisansüstü Eğitim Enstitüsü
- Ana Bilim Dalı: Petrol ve Doğal Gaz Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Petrol ve Doğal Gaz Mühendisliği Bilim Dalı
- Sayfa Sayısı: 111
Özet
Enerji, modern toplumların sürdürülebilir kalkınması ve ekonomik büyümesi için vazgeçilmez bir unsurdur. Artan nüfus ve sanayileşme, enerji talebini her geçen gün artırmakta ve bu talebi karşılamak için petrol ve doğal gaz en önemli enerji kaynakları arasında yer almaktadır. Bu kaynakların etkin ve verimli bir şekilde çıkarılması ise sondaj operasyonlarının başarısına doğrudan bağlıdır. Sondaj operasyonlarında kullanılan sondaj çamuru, matkabın soğutulması, kuyu duvarının stabil tutulması, kaya parçalarının yüzeye taşınması ve kuyu basıncının kontrolü gibi kritik işlevleri yerine getirir. Sondaj çamuru özelliklerinden biri olan çamur alkalinitesi (PM) ve filtrat alkaliniteleri (MF ve PF) testlerinde kullanılan geleneksel yöntemler, zaman alıcı olmaları ve insan hatalarına açık yapıları nedeniyle sondaj operasyonlarında önemli verimlilik kayıplarına yol açabilmektedir. Bu tez, veri odaklı makine öğrenimi modelleri geliştirerek bu süreçleri hızlandırmayı ve sondaj saha verileriyle karşılaştırılabilir sonuçlar elde etmeyi amaçlamaktadır. Petrol ve doğalgaz mühendisliği kapsamında gerçekleştirilen bu çalışma, makine öğrenimi tekniklerinin sondaj operasyonlarının operasyonel risklerini azaltmak ve maliyetlerini düşürmek için nasıl kullanılabileceğini incelemektedir. Geleneksel alkalinite testlerinin yerini alabilecek bu modeller, sürecin hızlandırılmasının yanı sıra tutarlı ve doğruluğu yüksek sonuçlar sunmaktadır. Çalışma kapsamında öncelikle deneysel çalışmalar yapılarak alkalinite ölçümleri sırasında karşılaşılabilecek hata payları belirlenmiştir. Model tabanlı çalışmaya geçildiğinde ise ilk olarak farklı jeolojik ve operasyonel koşulları temsil eden 1600 sondaj raporu verisi kullanılmıştır. Veriler, çamur özellikleri, sıvı kaybı, kimyasal bileşimler ve basınç koşulları gibi farklı sondaj parametrelerini içeren kapsamlı bir veri setine dönüştürülmüştür. Veri ön işleme aşamasında eksik ve tutarsız veriler temizlenmiş, aykırı değerler belirlenerek analiz dışı bırakılmıştır. Bu süreçte, verilerin doğru bir şekilde modellenebilmesi için Python kütüphaneleri (Tabula, PyMuPDF vb.) kullanılmış ve veri seti yüksek doğrulukla yapılandırılmıştır. Makine öğrenimi algoritmaları arasında Doğrusal Regresyon, Ridge Regresyon, Lasso Regresyon, ElasticNet, Rastgele Orman (Random Forest), Gradient Boosting, XGBoost, CatBoost, LightGBM, Destek Vektör Regresyonu (SVR) ve Çok Katmanlı Algılayıcı (MLP) kullanılmıştır. Modellerin optimizasyonu, GridSearchCV yöntemi kullanılarak gerçekleştirilmiş ve en iyi hiper parametre kombinasyonları belirlenmiştir. Sonuç olarak 17 girdi parametresine sahip olan veri seti 80% eğitim ve 20% test veri seti olarak ikiye ayrılmıştır. En iyi modelin değerlendirme aşamasında ise hem eğitim hem de test veri setinden elde edilen Determinasyon Katsayısı (R2) Ortalama Hata Karesi (MSE), Ortalama Mutlak Hata (MAE), Ortalama Mutlak Yüzde Hatası (MAPE) değerleri dikkate alınmıştır. Bu performans metriklerinin hepsini en iyi modelleri belirleme sürecinde kullanmak amacıyla, çok kriterli karar verme yaklaşımı olan TOPSIS (İdeal Çözüme Dayalı Sıralama Tekniği) kullanılmıştır. Ön hazırlık aşamasında, alkalinite ölçüm değerlerinin (PM, PF ve MF) birbirleriyle ilişkili olup olmadığı kontrol edilmiştir. Bu ilişki gözlemlendikten sonra, bu aşamada diğer sondaj parametrelerini girdi olarak kullanarak hangi alkalinite ölçümünün daha yüksek sonuç vereceğini kontrol etmek için basit bir makine öğrenmesi çalışması yapılmıştır. MF ölçümünün diğer alkalinite ölçümlerine kıyasla daha doğru tahmin edildiği belirlenmiştir. Test edilen modellerin ortalama determinasyon katsayısı değerleri Eğitim R2 = 0.88 ve Test R2 = 0.705 olarak çıkmıştır ve çalışmanın ilk aşamasına geçilmiştir. Çalışmanın ilk aşamasında ise, MF parametresi üzerine yoğunlaşılmış ve daha geniş kapsamlı bir makine öğrenmesi çalışması yapılmıştır. XGB (Extreme Gradient Boosting) algoritması, MF tahmini için en yüksek performansı göstermiştir. Modelin doğruluğu, Eğitim R2 = 0.996, Test R2 = 0.858 olarak hesaplanmıştır. Ayrıca, veri ekleme ve çıkarma işlemleri ve SHAP analizi kullanılarak parametrelerin modele katkıları değerlendirilmiş ve gereksiz parametreler kaldırılmıştır. Bu analiz sonucunda, belirli parametrelerin tahmin performansına etkisinin minimal olduğu tespit edilmiş ve bu parametreler veri setinden çıkarılmıştır. İkinci aşamada, ön çalışmada gözlemlenen alkalinite ölçüm değerleri arasındaki ilişkiler referans alınmıştır. Veri setindeki MF değerleri ile PF ve PM değerleri arasında en iyi ilişki yakalayan model belirlenmeye çalışılmıştır. PF tahmini için RF (Random Forest) algoritması en iyi performansı göstermiştir ve doğruluk değerleri Eğitim R2 = 0.882 ve Test R2 = 0.864 olarak elde edilmiştir. PM tahmini için ise Extreme Gradient Boosting (XGB) algoritması ilişkiyi en iyi yakalayan model olarak belirlenmiş ve doğruluk değerleri Eğitim R2 = 0.809 ve Test R2 = 0.802 olarak hesaplanmıştır. Bu modeller belirlendikten sonra da diğer sondaj parametreleri ile MF tahmini yapılıp, bu tahmin değerleri kullanılarak ikinci aşamada belirlenen modellerle birlikte PF ve PM değerlerinin tahmini yapılacaktır. Bu süreç, tek bir veri seti kullanılacağı için modelin karmaşıklığını azaltarak daha hızlı ve güvenilir tahminlerin elde edilmesini sağlamıştır. Sonuçlar, Ensemble algoritmalarının (XGB ve RF) MF, PF ve PM tahminlerinde en yüksek doğruluğu sağladığını gözlemlenmiştir. Bu durum ağaç tabanlı algoritmaların bu parametrelerinin tahmini için daha uygun olduğunu göstermektedir. Elde edilen sonuçlar, modelin saha koşullarında kullanılabilirliğini ve doğruluğunu doğrulamaktadır. Tezin bir diğer katkısı, kullanıcı dostu bir arayüzle desteklenen bir Streamlit uygulamasının geliştirilmesidir. Bu uygulama sayesinde kullanıcılar, veri yükleme, model eğitimi ve tahmin sonuçlarını görselleştirme gibi işlemleri kolaylıkla gerçekleştirebilir. Uygulama, saha mühendisleri ve teknik ekipler için hızlı ve etkili bir çözüm sunmaktadır. Sonuç olarak, bu tez, veri odaklı makine öğrenimi modellerinin sondaj çamuru ve filtrat alkalinitesi tahmininde güvenilir ve etkin araçlar olduğunu kanıtlamaktadır. Geliştirilen modeller ve uygulama, saha operasyonlarında daha hızlı, karşılaştırılabilir ve maliyet etkin kararlar alınmasına olanak sağlayarak operasyonel verimliliği artırmakta ve özellikle sondaj parametrelerinin geleneksel test yöntemleri yerine otomasyon sistemleriyle ölçülmeye başlandığı son yıllarda alkalinite ölçümünün otomasyon sürecine dahil edilmesi ve makine öğrenimi tekniklerinin petrol ve doğalgaz mühendisliği alanındaki potansiyelini göstermektedir. Çalışmadan çıkarılan temel sonuçlar ise şunlardır: XGB (Extreme Gradient Boosting) ve RF (Random Forest) algoritmaları, sondaj çamuru (PM) ve filtrat alkalinitesi (PF ve MF) tahmininde en yüksek doğruluk oranlarına ulaşmıştır. Veri odaklı modeller, geleneksel alkalinite test yöntemlerine kıyasla daha hızlı ve karşılaştırılabilir sonuçlar sunarak sondaj operasyonlarında önemli ölçüde zaman tasarrufu sağlamaktadır. Ayrıca, bu çalışma veri odaklı yaklaşımların sondaj operasyonlarında etkinliğini kanıtlayarak enerji endüstrisinin dijitalleşme sürecine katkı sağlamış ve elde edilen sonuçlar, farklı operasyonel koşullarda ve daha geniş veri setlerinde test edilerek genellenebilir ve daha esnek hale getirilebilir modeller için sağlam bir temel oluşturmuştur.
Özet (Çeviri)
Energy is essential for the sustainable development and economic growth of modern societies. As the population and industrialization grow, energy demand increases daily. Oil and natural gas are among the most important energy sources to meet this demand. Extracting these resources efficiently depends on the success of drilling operations. Drilling mud, used in these operations, performs key functions such as cooling the drill bit, stabilizing the wellbore, transporting rock cuttings to the surface, and controlling well pressure. Traditional methods for measuring mud alkalinity (PM) and filtrate alkalinity (MF and PF) are slow and prone to human error. These issues can reduce the efficiency of drilling operations. This thesis aims to speed up these processes and provide reliable results using data-driven machine learning models. The study focuses on how machine learning can reduce operational risks and costs in drilling operations. These models not only save time but also provide consistent and accurate results compared to traditional testing methods. As part of the study, experimental work was first contucted to identify the potential error margins encountered during alkalinity measurements. When transitioning to the model-based approach, 1600 drilling reports, covering different geological and operational conditions were used. The data includes drilling parameters such as mud properties, fluid loss, chemical composition, and pressure conditions. In the preprocessing stage, missing and inconsistent data were cleaned, and irrelevant data points were removed. Python libraries (e.g., Tabula, PyMuPDF) were used to structure the dataset accurately. Various machine learning algorithms were applied, including Linear Regression, Ridge Regression, Lasso Regression, ElasticNet, Random Forest, Gradient Boosting, XGBoost, CatBoost, LightGBM, Support Vector Regression (SVR), and Multi-Layer Perceptron (MLP). The best hyperparameters for each model were found using GridSearchCV. The dataset was split into 80% for training and 20% for testing. Models were evaluated using metrics such as R² (Determination Coefficient), MSE (Mean Squared Error), MAE (Mean Absolute Error), and MAPE (Mean Absolute Percentage Error). Best models for each alkalinity measurements were determined by using TOPSIS (The Technique for Order of Preference by Similarity to Ideal Solution) which is the multi-criteria decision-making approach of tested models in this study. Firstly, the relationship between alkalinity measurements (PM, PF, and MF) was analyzed in preliminary part. It was observed that MF values were the most accurately predicted compared to other alkalinity measurements. The average accuracy was R² = 0.88 for training and R² = 0.705 for testing. In the first stage, the focus shifted to predicting MF using a more detailed machine-learning approach. XGB (Extreme Gradient Boosting) algorithm performed best, with an accuracy of R² = 0.996 for training and R² = 0.858 for testing. Using SHAP analysis, less important parameters were removed to improve model performance. Next, the relationships between MF, PF, and PM values were studied. RF (Random Forest) algorithm gave the best results for relationship between MF and PF with R² = 0.882 for training and R² = 0.864 for testing. For predicting PM, the Extreme Gradient Boosting (XGB) algorithm performed best for relationship between MF and PF, with an accuracy of R² = 0.809 for training and R² = 0.802 for testing. Using these models, MF values were predicted with using other drilling parameters, and these predictions were then used to estimate PF and PM values. This approach simplified the process, reduced model complexity, and improved speed and reliability. The results showed that XGB and RF models provided the highest accuracy for predicting MF, PF, and PM. These algorithms, which are tree-based techniques, were found to be the most suitable for this task. A user-friendly Streamlit application was also developed as part of this thesis. This app allows users to upload data, train models, and visualize prediction results easily. It provides a fast and efficient tool for engineers and technical teams in the field. This thesis demonstrates that machine learning models, particularly Extreme Gradient Boosting (XGB) and Random Forest (RF), are reliable and effective tools for predicting drilling mud and filtrate alkalinity (PM, PF, and MF). These data-driven models outperform traditional testing methods by being faster, more reliable, and more accurate. The study supports the digital transformation of the energy industry, showing the effectiveness of machine learning in optimizing drilling operations. The results are applicable to larger datasets and various operational conditions, making the models more flexible and generalizable. Additionally, a user-friendly Streamlit application was developed to enable users to easily upload data, train models, and visualize prediction results. This research also highlights the growing role of machine learning in the oil and gas industry, particularly as drilling parameters are increasingly measured using automation systems. By integrating alkalinity measurement into the automation process, this study provides significant advancements in efficiency, cost reduction, and accuracy in drilling operations.
Benzer Tezler
- Test verilerine dayalı, makine öğrenmesi ve derin öğrenme yöntemleri ile batarya sağlık durumu tahmini
Battery state of health estimation based on test data using machine learning and deep learning methods
MEHMET ALİ ARSLANTAŞ
Yüksek Lisans
Türkçe
2025
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiMekatronik Mühendisliği Ana Bilim Dalı
PROF. DR. FİKRET ÇALIŞKAN
- Gemi elektrik şebekelerinde derin öğrenme uygulamaları
Deep learning applications on ship electric grids
TAYFUN UYANIK
Doktora
Türkçe
2023
Deniz Bilimleriİstanbul Teknik ÜniversitesiDeniz Ulaştırma Mühendisliği Ana Bilim Dalı
PROF. DR. YASİN ARSLANOĞLU
PROF. DR. ÖZCAN KALENDERLİ
- Estimation of commercial building energy consumption with machine learning
Makine öğrenimi ile ticari bina enerji tüketimi tahmini
YOUSIF MURSHID MUHEALDDIN MUHEALDDIN
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolÇankırı Karatekin ÜniversitesiElektrik ve Bilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. SELİM BUYRUKOĞLU
DR. ÖĞR. ÜYESİ MOHAMMED RASHAD BAKER BAKER
- Etkin bina emlak vergi değerinin belirlenebilmesi için makine öğrenme temelli bir değerleme modeli önerisi
A proposal for a machine learning based valuation model for determining efficient building property tax value
ELİF ŞEVVAL TAŞTAN
Yüksek Lisans
Türkçe
2025
Jeodezi ve Fotogrametriİstanbul Teknik ÜniversitesiGeomatik Mühendisliği Ana Bilim Dalı
PROF. DR. REHA METİN ALKAN
- Machine-learning approaches for neurological disorder diagnosis from genomic and neuroimaging data
Genomik ve nörogörüntüleme verilerinden nörolojik bozukluk teşhisi için makine öğrenmesi yaklaşımları
İSMAİL BİLGEN
Doktora
İngilizce
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. BEHÇET UĞUR TÖREYİN