Forecasting the performance of shale gas wells using machine learning
Makine öğrenmesi kullanarak şeyl gaz kuyularının performansının tahmin edilmesi
- Tez No: 824796
- Danışmanlar: DOÇ. DR. FAZIL EMRE ARTUN
- Tez Türü: Yüksek Lisans
- Konular: Petrol ve Doğal Gaz Mühendisliği, Petroleum and Natural Gas Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2023
- Dil: İngilizce
- Üniversite: İstanbul Teknik Üniversitesi
- Enstitü: Lisansüstü Eğitim Enstitüsü
- Ana Bilim Dalı: Petrol ve Doğal Gaz Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Petrol ve Doğal Gaz Mühendisliği Bilim Dalı
- Sayfa Sayısı: 155
Özet
Enerji talebinin artışı, son iki on yılda sıradışı şeyl rezervuarlarından üretimi teşvik eden itici güç olmuştur. Bu, gelişen yatay sondaj teknolojisi ve çok aşamalı hidrolik kırılma teknikleri ile birlikte gelmiştir (Kulga et al., 2017). Bu rezervuarlar, nanodarsilerle ölçülen ultra düşük geçirgenlikli kayalar olarak karakterize edilmektedir. Bu nedenle, sıradışı şeyl gibi karmaşık sistemlerde sayısal rezervuar simülatörleri gibi geleneksel rezervuar mühendisliği yaklaşımları, rezervuar analizi birçok farklı yönüyle zorluklar yaşamıştır. Bu, yavaşlamasına ve hatta ilerlemeyi zorlaştırmasına neden olmuştur. Ayrıca, hesaplama açısından verimsiz olabilir ve hatta daha pahalı olabilir, bu da sayısal modellere güvenmenin zorlaştığını gösterir (Ertekin ve Sun, 2019). Bu zorluklar, son on yılda ivme kazanan petrol endüstrisinde gerçek verileri kullanma yaklaşımındaki değişimin ardındaki itici güç olarak kabul edilmektedir. Veri tabanlı makine öğrenimi algoritmaları modelleri, rezervuar simülatörleri ile karşılaşılan zorluklardan kaçınmaya yardımcı olurken, hesaplama yükünü azaltma, verimliliği artırma, zaman tasarrufu sağlama ve hızlı tepki verme yeteneklerine sahiptirler (Schuetter et al., 2018). Bu, mühendislerin modelleme hedeflerine ulaşmasına ve hızlı kararlar almasına yardımcı olur (Kulga et al., 2017). Bu çalışma, yakın tarihli bir veri kümesi kullandı (SPE, 2021). Veri kümesi, Eagle Ford, Marcellus ve Haynesville şeyl oluşumlarından 53 şeyl kuyusunu içeriyor ve rezervuar ve operasyonel özellikler arasında dağıtılan 20 parametreyi içermektedir. Bu çalışmada, sıradışı rezervuarlardaki gaz üretim performansını etkileyen ana parametreleri incelemek ve anlamak için bir veri analitiği yaklaşımı kullanılmıştır (örneğin, 1 yıl sonrası gözlenen toplam gaz üretimi). Çalışma temelde iki ana tekniği kullanmıştır: keşifsel veri analizi (EDA) ve tahmin edici veri analitiği modellemesi. Keşifsel veri analizi, veri kümesinin yapısını incelemek ve veri hakkında daha derinlemesine bir anlayış elde etmek için kullanılmıştır. Ayrıca, değişkenler arasındaki ilişkileri daha iyi anlamaya katkı sağlamıştır. keşifsel veri analizi, tek değişkenli, çift değişkenli ve çok değişkenli analizi içeren üç aşamalı bir analizdir. Tek değişkenli analiz, veri kümesindeki her parametreyi, kutu grafikleri kullanarak bir boyutta (birikmiş gaz üretimi dahil) görsel olarak temsil etmek için kullanılır. Bu, değişkenleri tek tek, dağılım simetrisini ve dağılım simetrisini yanı sıra veri kümesindeki aykırı değerleri algılama konusunda yardımcı olur. Çift değişkenli analiz, birikmiş gaz üretimi ile her bir rezervuar ve operasyonel parametre arasındaki ilişkiyi araştırmak amacıyla uygulanmıştır. Bu bağlamda, Pearson ve Spearman korelasyon katsayıları, giriş ve yanıt değişkenleri arasındaki lineer ilişkinin gücünü değerlendirmek için kullanılmıştır. Ayrıca, çok değişkenli analiz, çok sayıda rezervuar ve operasyonel parametre arasındaki ilişkiyi ve parametreler arasındaki ilişkiyi belirlemeye yardımcı olan korelasyon matrisini kullanarak birçok parametre arasındaki korelasyonu belirlemeye yardımcı olmaktadır. Bu çalışmada kullanılan EDA, birikmiş gaz üretimi ile ilişkili olan parametreleri doğrulamanın temel adımıdır ve değişkenler arasındaki ilişkileri ve her bir parametre ile birikmiş gaz üretimi arasındaki ilişkiyi anlamak için kullanılır. Model geliştirmek için kullanılan iki temel yöntem vardı: çoklu doğrusal regresyon (MLR) ve ağaç tabanlı yöntemler. Ağaç tabanlı yöntemler, regresyon ağacı, bagging, random forest (RF) ve ekstrem gradyan artırma makinesi (XGBoost) içeriyordu. Çoklu doğrusal regresyon, tüm tahmin edici değişkenlerin eğim katsayısına dayalı olarak hedef değişkenin tahminini yapar bir proxy modeldir. Sonuçlanan proxy denklem daha sonra görünmeyen veriler için birikmiş gaz üretimini tahmin etmek için kullanılabilir. Regresyon ağacı, basit ve oldukça yorumlanabilir bir yöntemdir. Veri kümesini, öncelikle en etkili tahmin ediciyi birincil bölünme (kök düğüm) olarak kullanarak böler. Daha sonra, veri ağaç üzerinde iki tarafın her iki tarafında daha az etkiye sahip karar düğümleri oluşturarak dallanır. Karar düğümleri, kök düğümünden hedef değişken üzerinde daha az etkiye sahiptir. Bu dallanma, daha fazla bölünme mümkün olduğu sürece devam eder; aksi takdirde, süreç bir terminal düğüme ulaşır. Bu terminal düğümler sonunda yanıt değişkeninin ortalama tahmin değerlerini temsil eder, bu bağlamda 1 yıl sonra birikmiş gaz üretimini temsil eder. XGBoost, algoritmaların optimizasyonunun mevcut olması nedeniyle ölçeklenebilir bir makine öğrenme yöntemidir. Bu nedenle, XGBoost modeli, kullanılan özel veri kümesine uygun olacak şekilde ayarlanabilir ve bu, aşırı uyum riskini önlemeye yardımcı olur. En iyi ayar parametrelerini tahmin etmek için çapraz doğrulama tekniği kullanılabilir. RF'den farklı olarak, regresyon ağacı paralel olarak inşa edilen ağaçlar yerine bağımlı bir modeldir, bu da her bir son tahmin edilen ağacın çıktısına bağlı olduğu anlamına gelir. Bu modelin son tahminleri, tüm bireysel ağaçların tahminlerini toplamak suretiyle hesaplanır. Kısacası, çoklu doğrusal regresyon (MLR), regresyon ağacı, bagging, RF ve XGBoost dahil olmak üzere beş istatistiksel ve makine öğrenimi yöntemi kullanılarak şeyl gaz kuyularının performansını doğru bir şekilde tahmin edebilen bir model geliştirmek için kullanılmıştır. Her bir model için veri kümesi %80 ve %20 olarak ikiye bölünmüş ve eğitim ve test için kullanılmıştır. Eğitim verileri modeli eğitmek için kullanılırken, test verileri modeli doğrulamak için kullanılmıştır. Bu çalışmada her bir modelin performansını değerlendirmek için üç yaygın metrik kullanılmıştır. Bu metrikler ortalama mutlak hata (AAE), kök ortalama kare hatası (RMSE) ve belirlilik katsayısı (R2) şeklinde sıralanabilir. En düşük tahmin hatası ve en yüksek R2 değeri olan model seçilecektir. Bu çalışmada kullanılan son yöntem, şeyl gaz kuyularımızın performansı üzerinde en fazla etkisi olan parametreleri ve geliştirilen modeldeki en fazla tahmin yeteneğine sahip olan parametreleri belirlemek için kullanılan değişken önemliliği yaklaşımıdır. Bu çalışmanın sonuçları, birikmiş gaz üretimi ile simetrik bir dağılıma ve kesin bir monoton ilişkiye sahip bir dizi rezervuar ve operasyonel parametreyi göstermektedir, bunlar arasında gaz doygunluğu, su doygunluğu, gözeneklilik, rezervuar kalınlığı, lateral uzunluk, hidrolik kırılmaya ilişkin aşama sayısı ve alt perforasyon bulunmaktadır. Tüm değişkenler arasında gaz doygunluğu, en güçlü korelasyona sahip olan değişkendir. Ayrıca, 1 yıl sonra birikmiş gaz üretimini tahmin etmek için kullanılan beş model arasında, ekstrem gradyan artırma makinesi (XGBoost) en iyi sonuçları göstererek gaz üretimini tahmin etmek için en iyi teknik olduğunu kanıtlamıştır, çünkü en düşük Kök Ortalama Kare Hatası (RMSE) ve en yüksek Belirlilik Katsayısı (R2) değerlerini vermiştir. XGBoost modeli, çapraz doğrulama yoluyla türetilen en iyi ayar parametrelerini kullandı, bu da tüm gözlemleri ve yalnızca kullanılabilir tahmin edicilerin %80'ini kullanmayı ve ağaçların maksimum üç düzeyine sahip olmayı içerir. Bu, kök düğüm ile terminal düğüm arasındaki düğüm sayısının en fazla üç bölünme olacak şekilde olduğu anlamına gelir. Ayrıca, sadece 150 adet artırma turu (iterasyon) kullanmayı önermiştir, bu da modelin daha fazla iterasiyon yapmayarak işlemi durdurur ve aşırı uyum riskini durdurmayı önerir. Son olarak, sıradışı şeyl rezervuarlarda gaz üretim performansını tahmin etme konusunda en yüksek tahmin yeteneğine sahip olan anahtar değişkenler belirlenmiştir. XGBoost ve rastgele orman yöntemleri, şeyl kuyularının performansını etkileyen en üstteki 6 etkili parametre konusunda uyumludur. Bu parametreler, rezervuar ve operasyonel parametreler arasında dağılmıştır. Aşama sayısı, lateral uzunluk ve alt perforasyon gibi operasyonel parametrelerle gaz doygunluğu, gözeneklilik ve kalınlık gibi rezervuar parametreleri diğer rezervuar ve operasyonel parametrelerden daha baskındır. XGBoost ve RF tarafından yapılan genel değişken önemliliği yaklaşımı, ayrıca regresyon ağacının lateral uzunluğu ve aşama başına küme sayısını ana parametreler olarak kullanarak ağacı bölmek için ana parametreleri sıralama eğilimindedir. Bu sonuçlar, benzer çalışmaların bulgularıyla tutarlıdır (Schuetter et al., 2018). Gaz doygunluğu, birikmiş gaz üretimini tahmin etmek için en kritik olarak değerlendirilen temel bir parametredir. Bu çalışmanın bulguları, benzer tahmin modellemesi projelerinin geliştirilmesine katkı sağlayacaktır.
Özet (Çeviri)
Utilization of real data to develop data-driven models in the petroleum industry has gained momentum in the past decade. The challenges related to modeling unconventional reservoirs has been recognized as the driving force behind this change in approach. Data-driven models help to enhance operations, increase efficiency and save time. In the meantime, several numerical reservoir simulators are used for modeling and forecasting the performance of shale gas wells. However, these models are computationally expensive and the simulators could indirectly face with difficulties in forecasting performance for the unconventional shale reservoirs comparing to conventional ones. This study employs a data analytics approach to investigate and gain understanding into the main driver parameters that influence the gas production performance in unconventional reservoirs (i.e. cumulative gas production after one year). The dataset utilized in this study is acquired from SPE Data Repository and consist of 53 wells (SPE, 2021). The study essentially utilized two primary methods, namely exploratory data analysis (EDA) and predictive data analytics modeling. Through the utilization of exploratory data analysis (EDA), the correlation between each reservoir and operational parameter with the cumulative gas production (Gp) is clearly identified. A number of reservoir and operational parameters display a strictly monotonic relationship with the gas production. Out of all variables, gas saturation was the variable, which demonstrated the strongest correlation. Furthermore, predictive data-analytics models based on statistical and machine learning algorithms were developed to forecast the cumulative gas production after 1 year. Among the five conducted models, extreme gradient boosting machine (XGBoost) proved to be the optimal technique for forecasting gas production, as it yielded the highest Coefficient of Determination (R2) and the lowest Root Mean Square Error (RMSE). Finally, an analysis of variable importance was conducted to determine the key variables, which have the highest predictive power in forecasting gas production performance in unconventional shale reservoirs. The operational parameters such as the number of stages, lateral length and bottom perforation along with reservoir properties such as gas saturation, porosity and thickness are more dominant than the other reservoir and operational parameters. Gas saturation is the most critical parameter, which is considered as the key driver of forecasting the gas production. The findings of this study will be beneficial in the design and development similar forecasting modelling projects.
Benzer Tezler
- State of charge estimation of lithium-ion batteries using machine learning approach
Makine öğrenmesi yaklaşımı kullanılarak lityum iyon pillerin şarj durumu tahmini
OSMAN ALPER ALTUN
Yüksek Lisans
İngilizce
2024
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiElektrik Mühendisliği Ana Bilim Dalı
PROF. DR. EMİNE AYAZ
- Türkiye genelinde Bahel modeli ve yapay sinir ağları ile güneş radyasyonu tahmini
Solar radiation estimation for Turkey using Bahel model and artificial neural networks
ELVAN BURCU KOŞMA
Yüksek Lisans
Türkçe
2018
Enerjiİstanbul Teknik ÜniversitesiEnerji Bilim ve Teknoloji Ana Bilim Dalı
DR. ÖĞR. ÜYESİ BURAK BARUTÇU
- Türkiye gün öncesi elektrik piyasasında saatlik fiyatların uzun dönemli olarak tahmin edilmesi için fundamental bir yöntem geliştirilmesi
Development of a fundamental model for forecasting long-term hourly prices in the Turkish day-ahead electricity market
OZAN KORKMAZ
Doktora
Türkçe
2024
Enerjiİstanbul Teknik ÜniversitesiEnerji Bilim ve Teknoloji Ana Bilim Dalı
PROF. DR. BİHRAT ÖNÖZ
- Meteorolojik değişkenlerin elektrik tüketimi üzerindeki etkisi
Effects of meteorological variables on electricity consumption
BEYTİYE DERYA AYDIN
Yüksek Lisans
Türkçe
2016
Enerjiİstanbul Teknik ÜniversitesiMeteoroloji Mühendisliği Ana Bilim Dalı
DOÇ. HÜSEYİN TOROS
- Hava kirliliği konusunda çevre bilgi sistemi tasarımı ve gerçekleştirilmesi pilot projesi
Design of an information system about air pollution
HARUN İYİDİKER