Geri Dön

Short-term wind power generation forecasting by coupling numerical weather prediction models and machine learning algorithms

Sayısal hava tahmin modeli ve makine öğrenmesi algoritmaları ile kısa dönemli rüzgar enerjisi üretim tahmin modeli oluşturmak

  1. Tez No: 746666
  2. Yazar: CEM ÖZEN
  3. Danışmanlar: PROF. DR. ALİ DENİZ
  4. Tez Türü: Doktora
  5. Konular: Enerji, Meteoroloji, Energy, Meteorology
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2022
  8. Dil: İngilizce
  9. Üniversite: İstanbul Teknik Üniversitesi
  10. Enstitü: Lisansüstü Eğitim Enstitüsü
  11. Ana Bilim Dalı: Meteoroloji Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Atmosfer Bilimleri Bilim Dalı
  13. Sayfa Sayısı: 154

Özet

Yenilenebilir enerjinin, ülkelerin enerji arz güvenliğini sağlamakta ve enerji bağımsızlığını elde edebilmelerinde oldukça önemli bir yeri bulunmaktadır. Diğer yandan, fosil yakıtlarla konvensiyonel enerji üretiminin alternatifi olan yenilenebilir enerjiye geçişin, küresel iklim değişikliğinin önüne geçebilmek için de oldukça önemli bir yeri bulunmaktadır. Bu sebeplere ek olarak; son yıllarda hem yenilenebilir hem de diğer enerji kaynakları arasında en ucuz seviyelendirilmiş enerji maliyetlerinden birine sahip olan rüzgar enerjisi, ülkeler ve yatırımcılar arasında da öncelikli bir enerji kaynağı haline gelmiştir. Rüzgar enerjisi santrallerinde elde edilen enerji üretimi, dinamik ve kaotik yapısıyla tahmin edilmesi oldukça zor bir atmosferik değişken olan rüzgarla ilişkilendirilmektedir. Diğer yandan, toplam enerji payındaki yerini giderek arttırmaya devam eden ve sürekliliği olmayan bir enerji kaynağı olan rüzgarın tahmini, elektrik şebekelerinin dengesi ve tutarlılığı açısından da oldukça önemli hale gelmektedir. Ülkemizde ve dünyada, enerji arz güvenliğini sağlamak ve elektrik şebekelerini dengede tutabilmek için tüm enerji santrallerinde olduğu gibi, rüzgar enerjisi santrallerinin de enerji üretim tahminlerini, ülkelerin enerji piyasalarından ve/veya elektrik iletiminden sorumlu kurumlarına taahhüt etmeleri gerekmektedir. Bu tahminlerin, gerçek üretimden olan sapmaları enerji dengesizliği oluşturmakta ve bu durum santral sahipleri için enerji dengesizlik cezalarına neden olmaktadır. Böylelikle enerji üretim tahminlerinin tutarlılığının arttırılması, hem santral sahiplerine kesilecek büyük maddi cezaların önüne geçilmesini sağlarken; hem de ülkelerin enerji şebekelerinin kontrolünü kolaylaştırarak, enerji arz güvenliğine katkıda bulunmaktadır. Ülkemizde, kısa dönemli rüzgar enerjisi üretim tahminleri gün öncesi ve gün içi olmak üzere iki farklı şekilde değerlendirilmektedir. Gün öncesi rüzgar enerjisi üretim tahminleri serbest piyasada, saatlik piyasa takas fiyatlarının belirlenebilmesi için Enerji Piyasaları İşletme A.Ş.'ye ve şebekenin kontrolü için Türkiye Elektrik İletim A.Ş.'ye günlük olarak taahhüt edilmektedir. Bu tahminlerin kapanış saatleri sırasıyla Türkiye saatiyle 12:30 ve 16:30'dur. Her iki kurum da, tahmin ve gerçekleşen üretim arasındaki fark nedeniyle oluşan enerji dengesizliğini ayrı ayrı cezalandırmaktadır. Diğer yandan, gün öncesinde taahhüt edilen tahminlerin bir saat öncesine kadar gün içi piyasasında da değiştirilme fırsatı söz konusudur. Böylelikle, gün içi piyasasında işlemler yapılarak enerji dengesizlik cezaları minimize edilebilmektedir. Bu tez çalışmasında, kısa dönemli rüzgar enerjisi üretim tahminleri detaylı olarak ele alınmış ve bu konuda hazırlanan üç adet makale uluslararası hakemli Wind Engineering degisinde yayımlanmıştır. İlk makalede, Kayseri ili içerisinde bulunan Yahyalı rüzgar enerjisi santrali için sayısal hava tahmin modeli olan WRF modeli, gradyan artırma makineleri ile birleştirilerek; yeni bir hibrit gün öncesi rüzgar üretim tahmin modeli sunulmuştur. Önerilen modelin WRF kısmına ait çıktılar, makine öğrenmesi modeline doğrudan girdi olarak kullanılırken; bu doğrultuda düşük çözünürlüklü WRF modeli çalıştırılmıştır. Bu modele girdi olarak, National Oceanic and Atmospheric Administration'ın (NOAA) 0.25° alansal çözünürlüğe sahip Global Data Assimilation System (GDAS) verisi kullanılmıştır. Model 10x10 noktadan oluşan tek alanlı, Yahyalı rüzgar enerjisi santralini ortalayacak ve 0.25° alansal çözünürlükte çıktı verecek şekilde konfigüre edilmiştir. WRF modelinin fiziksel parametrelerinin konfigürasyonu için literatürde rüzgar hızı tahmini için WRF modelinin kullanıldığı çalışmalar incelenmiş ve sıklıkla tercih edilen ve iyi sonuçlar veren parametrelerle ilerlenmiştir. Dağlık bir bölgede bulunan ve rakımı 1498 ve 1768 metreler arasında değişen toplamda 22 adet 2.4 MW rated powera sahip Nordex N117 türbini içeren Yahyalı WPP'yi surround eden 4 gridin atmosferik değişkenleri makine öğrenmesi modeline girdi olarak kullanılmıştır. Burada, doğrudan GDAS çıktılarını kullanmak yerine WRF modelinin kullanılmasının nedeni zamansal çözünürlüğü istatistiksel yöntemler yerine dinamik bir modelle 10 dakikalara kadar arttırmaktır. Bu 4 gridten toplamda 30 adet atmosferik değişken alınırken; diğer yandan modelin yaklaşık 108 metrelere denk gelen üçüncü dikey seviyeye ait rüzgar hızları kullanılarak bu noktalarda bir N117 2.4 rüzgar türbininin kurulu olduğu varsayımı ile bu türbinin enerji üretimi hesaplanmıştır. Son olarak, Yahyalı sahasının 10 dakikalık emre amadelik değerleriyle beraber, toplamda modelde 125 adet tahmin değişkeni kullanılmıştır. Çalışmada, makine öğrenmesi modelinin eğitim sürecinde kullanılmak üzere validasyon ve eğitim kümeleri oluşturulmuştur. 2018 yılının Ocak, Nisan, Temmuz ve Ekim aylarının tamamı validasyon kümesi olurken; validasyon kümesi hariç 2017 ve 2018 yıllarının tamamı ise eğitim kümesi olarak kullanılmıştır. Diğer yandan, verinin zaman serisi oluşuyla ilgili olarak bilgi akışını önleyebilmek adına validasyon kümesi seçilen aylardan üç gün öncesi ve sonrası veriden çıkarılmışlardır. Veride test kümesi olarak ise 2019 yılının, Ocak, Nisan, Temmuz ve Ekim aylarının ortasındaki 7 gün seçilmiş ve böylelikle toplamda 28 gün için oluşturulan tahmin modelinin performansı değerlendirilmiştir. Makine öğrenmesi algoritması olarak kullanılan gradyan artırma ağaçlarının hiperparametrelerini optimize etmek için rastgele uzay araştırması kullanılmıştır. Çalışmada, karar ağacı bazlı bir makine öğrenmesi algoritması kullanıldığından her bir değişkenin sonuç üzerindeki önemliliği de sunulmuştur. Burada en önemli değişkenler modelin 2. dikey seviyesindeki rüzgar hızı, rüzgar hızı bileşenleri ve sanal rüzgar türbini üretimleri olurken; en önemli grid noktaları santralin kuzeydoğu ve güneydoğusunda yer alan gridler olmuştur. Önerilen modelin, çıktılarını karşılaştırabilmek için yukarıda bahsedilen toplamda 28 test günü için yüksek çözünürlüklü WRF modeli de çalıştırılmıştır. Bu model çift yönlü iç içe 4 bölgeden oluşacak şekilde konfigüre edilirken; bu bölgelerin alansal çözünürlükleri sırasıyla 9, 3, 1 ve 0.333 km olarak belirlenmiştir. En iç bölgede toplamda 82x91 nokta bulunmaktadır. Bu modelde, daha önceden modele tanıtılan ilgili türbinin güç eğrileriyle doğrudan türbin bazlı üretim çıktısı almamızı sağlayan rüzgar türbini parametrizasyonu da çalıştırılmıştır. Böylelikle, yüksek çözünürlüklü WRF modelinin doğrudan enerji üretim tahmini yapması sağlanmıştır. Çalışmada gün öncesi tahmini üretmek ve tahminin model koşma süreleriyle beraber 12:30 öncesinde elde edilmesi esas olduğundan NOAA'nın 0.25° alansal çözünürlüğe sahip 00Z Global Forecast System (GFS) verileri kullanılmıştır. Bu veriler, Türkiye saatiyle yaklaşık olarak 06:00'da indirilebilir hale geldiğinden gün öncesi tahmin modeli için her gün en güncel veri seti olan 00Z GFS verisinin 15 ve 45. zaman adımları kullanılmıştır. Bu veriler doğrudan WRF modeline başlangıç ve sınır koşulu verisi olarak kullanılmakta ve ilk 6 saati WRF modelinin ısınma süresi için kullanılmaktadır. Yüksek çözünürlüklü WRF modeli ve önerilen hibrit modelin test kümesi üzerindeki performanslarının kıyaslamasında, önerilen hibrit model sayesinde ortalama mutlak hata, kök ortalama kare hata ve pearson korelasyon katsayısında sırasıyla 28.86%, 28.47%, 14.8% gelişme sağlanmıştır. Tahmninin performansının iyileştirilmesi yanı sıra, operasyonel süreçte önerilen model 28.75 saniyede sonuç üretebilirken; yüksek çözünürlüklü WRF modeli aynı makinede 2.9 saatte sonuç üretebilmektedir. Aynı zamanda, yüksek çözünürlüklü WRF modelinin aksine önerilen modelin düşük donanımlı bilgisayarlarda da rahatlıkla sonuç üretebileceğinin altı çizilmelidir. İkinci çalışmada ise, Türkiye için ülke bazlı gün öncesi rüzgar enerjisi üretim tahmin modeli önerilirken; modele farklı değişken seçme algoritmaları da entegre edilerek performans artışı ve model kurulum sürelerini düşürmek hedeflenmiştir. Bu çalışmada, birinci çalışmadan farklı olarak; WRF modeli çalıştırılmamış, bunun yerine tüm ülkeyi kapsayacak şekilde 2.5 derece alansal çözünürlüğe ve saatlik zaman çözünürlüğüne sahip sahip ECMWF'in ERA5 reanaliz verisi kullanılmıştır. Tüm Türkiye'yi 2.5 derece alansal çözünürlüğe sahip ERA5 verileriyle kaplamak için gerekli olan nokta sayısı 36 olurken; model eğitimi öncesinde nokta seçilim algoritmasıyla bu noktalar elenmiş ve 26 noktaya düşürülmüştür. Bu seçim aşamasında, Türkiye'nin kurulu rüzgar enerjisi santrallerinin alansal dağılımları göz önüne alınmış ve modelin operasyonel süreçte otomasyonunu sağlayabilmek adına 2.5 derece alansal çözünürlükteki her bir rüzgar enerjisi santralini çevreleyen noktalarla ilerlenmiştir. Seçilen noktalardan, yüzey, 700, 500 ve 300 hPa dikey seviyelerindeki sıcaklık, bağıl nem, rüzgar hızı bileşenleri, yüzey basıncı, jeopotansiyel gibi atmosferik değişkenler alınırken; modele girdi olarak kullanılması planlanan tahmin değişkenlerine seçilen noktalarda bulunduğu varsayılan sanal rüzgar türbinlerinin üretimleri de eklenmiştir. Bu noktalarda yer alan rüzgar türbinleri seçilirken; 2014 ve 2020 yılları arasında Türkiye'nin ERA5 ortalama 100 metre rüzgar hızı hesaplanmış ve her bir seçilen noktanın rüzgar sınıfı belirlenmiştir. Bu sınıfların her birini temsil edebilir bir rüzgar türbini belirleyebilmek için Türkiye Rüzgar Enerjisi Birliği (TÜREB) veri tabanından yararlanılmış ve Türkiye'de her bir sınıfın en çok kullanılan rüzgar türbini seçilmiştir (Nordex N117 2.4 ve 3 MW). Diğer yandan modele girdi olarak; bölge bazlı kurulu güçlerin kendi içlerindeki paylaşımları da eklenmiştir. Böylelikle, toplamda 766 adet tahmin değişkeni kullanılmıştır. Model eğitim kümesi için 1 Ocak 2014 ve Kasım 2019 tarih aralığı seçilirken; test kümesi olarak 1 Kasım 2019 ve 1 Kasım 2020 tarih aralığı seçilmiştir. Modelde test kümesi için ECMWF'in HRES modelinin 00Z çıktılarının 21 ve 45. zaman adımları aralığı kullanılmıştır. Böylelikle, HRES'in gün öncesi tahminlerini girdi olarak kullanırken; çalışmada önerilen modelin operasyonel kullanım için önü açılmıştır. Diğer yandan, Türkiye'nin kurulu gücünün sürekli artışı nedeniyle, modelin tahmin edilmesi istenen değişkeni olarak doğrudan Türkiye'nin saatlik rüzgar enerjisi üretimi kullanılmamış; bunun yerine saatlik üretimin toplam kurulu güce bölünmüş hali kullanılmıştır. Birinci çalışmada olduğu gibi, karar ağacı bazlı bir makine öğrenmesi algoritması kullanıldığından her bir değişkenin sonuç üzerindeki önemliliği de sunulabilmiştir. Diğer yandan, çalışmada değişken eleme yöntemlerine de yer verilirken; bu yöntemlerin her birinin model üzerindeki etkileri de ayrıca incelenmiştir. İlk olarak, tüm veride kolinearlik saptama yöntemleri uygulandıktan sonra, Lasso, iki farklı temel bileşen analizi, özyinelemeli değişken eleme, genelleştirilmiş ortogonal eşleşme takibi ve erken düşürmeli ileri yönlü değişken eleme yöntemleri kullanılmıştır. Bu yöntemler, değişken sayısını azaltarak modelin kompleksliğini düşürürlerken; aynı zamanda tutarlılığı arttırmak için kullanılmışlardır. Ayrıca, bu değişken seçme yöntemlerinin sonuçları kullanılarak; beş farklı hibrit değişken seçme yöntemi önerilmiştir. Bunlardan ilki, değişken seçme yöntemleri tarafından en fazla seçilen değişkenlere sahip grid noktasını seçerken; geri kalan dördü ise yukarıda bahsedilen altı farklı değişken seçme yönteminin sırasıyla, en az üç, dört, beş ve altısı tarafından seçilen değişkenleri seçmektedir. Çalışmada, en iyi hibrit değişken seçme yöntemi dördüncü yöntem olarak belirlenmiştir. Bütün modeller arasında dördüncü hibrit modelin başarısı, birinci ve beşinci hibrit yöntemler haricinde en düşük değişken ile en yüksek başarıma ulaşması açısından oldukça önemlidir. Önerilen modelin, bir yıllık test kümesi üzerindeki tahmin performansı için normalleştirilmiş kök ortalama kare hata ve R2 sırasıyla 7.6% ve 0.8989 olarak hesaplanmıştır. Diğer yandan, bu modelde en yüksek öneme sahip değişken; yerleştirilen yapay rüzgar türbinlerinin enerji üretimleriyken; bunu rüzgar hızı ve yönü takip etmektedir. Son olarak üçüncü çalışmada ise, Urla rüzgar enerjisi santralinin altı adet rüzgar türbininin rüzgar hızlarını 10 dakikadan 1 saate kadar tahmin eden kısa dönemli rüzgar hızı tahmin modeli önerilmiştir. Çalışmada, birinci çalışmada anlatılan şekliyle düşük çözünürlükte Urla santralini merkez alan 11x11 noktadan oluşan tek alanlı WRF modeli çalıştırılmıştır. Bu modelde başlangıç ve sınır koşulu verisi olarak 0.25 derece alansal çözünürlüğe sahip National Centers for Environmental Prediction/Final (NCEP/FNL) verisi kullanılırken; çıktının da 0.25 derece alansal çözünürlüğe sahip olması sağlanmıştır. NCEP/FNL verisinin doğrudan tahmin modelinde kullanılmamasın nedeni, tıpkı ilk çalışmada olduğu gibi verinin zaman çözünürlüğünü WRF modeli aracılığıyla arttırmaktır. Düşük çözünürlüklü WRF modelinin, Urla santralini çevreleyen 4 noktasından atmosferik değişkenler alınmıştır. Bu değişkenler, 10 metre ve modelin üçüncü dikey seviyesine (~108 metre) ait rüzgar hızı ve yönü, 2 metre hava sıcaklığı ve hava yoğunluğudur. Çalışmada doğrudan rüzgar hızı tahmini hedeflendiğinden, diğer çalışmalarda kullanılan sanal rüzgar türbini algoritmasına yer verilmemiştir. Diğer yandan, diğer çalışmalardan farklı olarak Urla santralini etkileyen hava paternleri de hesaplanmış ve doğrudan tahmin modeline girdi olarak kullanılmışlardır. Urla santralini etkileyen hava paternlerini hesaplayabilmek için Urla santralini merkez alan, girdi olarak yine NCEP/FNL verisini kullanan, 17x13 noktadan oluşan tek alanlı, 2.5 derece alansal çözünürlüğe ve 10 dakika zaman çözünürlüğüne sahip çıktılar veren WRF modeli çalıştırılmış ve modelin ortalama deniz seviyesi basınç çıktıları kullanılmıştır. Urla santralinde altı adet Nordex N117 rüzgar türbini bulunurken; türbinlerin kurulu güçleri 3 MW ve göbek yükseklikleri 91 metredir. Çalışmada önerilen modelde kullanılmak üzere sayısal hava tahmin modeli çıktılarına ek olarak; her bir rüzgar türbininin SCADA sisteminden kanat pitch açısı, rüzgar hızı, rüzgar yönü, üretimi, hava sıcaklığı ve basıncı değişkenleri alınmıştır. SCADA verilerini doğrudan kullanmanın yanında, bu veriye aynı zamanda anomali saptama, istatistiksel ve fiziksel yöntemlerle veri iyileştirme, kayıp verinin doldurulması gibi ön işlemler uygulanmıştır. Öncelikle, veride yer alan anomalileri/uç değerleri saptayabilmek için k-ortalamalar ve izolasyon ağacı uygulamalarının birleştirilerek kullanıldığı bir yöntem sunulmuş ve uygulanmıştır. Uç değer olarak saptanan güç verilerini iyileştirebilmek için hava yoğunluğu ve rüzgar hızını kullanan güç eğrisi fonksiyonu oluşturulurken; pitch açısı için anomali olarak atanmayan rüzgar hızı ve pitch açıları ile genelleştirilmiş eklemeli model oluşturulmuştur. Böylelikle, türbin bazlı pitch açısı ve güç verileri istatistiksel yöntemlerle iyileştirilmiştir. Diğer yandan, veride yer alan kayıpları doldurabilmek için yukarıda bahsedilen WRF modeli çıktılarıyla, Urla santrali türbinlerinin her bir değişkeni arasındaki ilişkiyi kurabilmesi için CatBoost modeli kullanılmıştır. Çalışmada SCADA, hava paterni, WRF modeli çıktıları olmak üzere 3 farklı veri ve SCADA verilerine uygulanan anomali saptama, veri iyileştirme ve kayıp veri doldurma işlemlerinin her birinin rüzgar hızı tahmin modeline olan etkisi ayrı ayrı incelenmiştir. Tahmin modeli için 1 Ocak 2017 ve 24 Eylül 2019 tarih aralığı eğitim kümesi olarak seçilirken; 1 Ekim 2019 ve 1 Ekim 2020 tarih aralığı test kümesi olarak seçilmiştir. Rüzgar hızı tahmin modelinin temelini CatBoost modeli oluşturmakta ve modelin hiperparametrelerinin optimizasyonu 60 farklı konfigürasyonla denenmiştir. Her türbinin 10 dakikadan 1 saate kadar 10'ar dakika aralıkla rüzgar hızı tahmini hedeflendiğinden modelde toplamda 36 adet tahmin edilmesi istenen değişken bulunmaktadır. Çalışmanın en iyi performansa sahip modeli tüm veri ön işlemlerinin yapıldığı ve tüm veri çeşitlerinin kullanıldığı model olmuştur. Çalışmada önerilen her bir model, bir önceki zaman adımını bir sonraki zaman için tahmin olarak kullanan basit persistans modelinin performansını geçmiştir. Diğer yandan, Urla'yı en çok etkileyen hava paterni 50.76% ile saf advektif olarak hesaplanırken, bu hava paterninde 14.534% ile en iyi ortalama mutlak hata yüzdesi elde edilmiştir. R2'ye göre en yüksek performans 0.9161 ile hibrit hava paternlerinde görülürken; en düşük kök ortalama kare hata ve ortalama mutlak hata genellikle düşük rüzgar hızıyla ilişkilendirilen saf antisiklonik hava paterninde görülmüştür. En iyi modelin en yüksek öneme sahip veri çeşidi SCADA olarak belirlenirken; WRF modeli çıktıları ikinci ve hava paterni verileri üçüncü olarak atanmışlardır. Tüm veride en önemli değişken ise, türbin bazlı güç ve pitch açıları olmuştur. Model içerisinde hava paternlerinin de kullanılması, tahminin son kullanıcıları için modelin performansının değişen hava paternlerinde nasıl değişeceği bilgisini de getirdiğinden oldukça önemli olmaktadır.

Özet (Çeviri)

Renewable energy has a crucial place in ensuring the security of the energy supply and achieving energy independence for the countries. Furthermore, the transition to renewable energy which is an eco-friendly alternative to the conventional power generation methods with fossil fuels has a very influential role in preventing global climate change. In addition to all these motives; wind energy has become a primarily preferred energy source for countries and investors thanks to having one of the cheapest levelized cost of energy among both renewable and other energy sources in recent years. The power generation in wind power plants is directly associated with the wind, which is an atmospheric variable that is difficult to predict with its dynamic structure and chaotic nature. Moreover, forecasting the wind which is an intermittent energy source becomes very important by considering the increasing ratio of the wind in the total energy share in terms of stability and reliability of the electricity grids. In order to ensure the energy supply security and keep the electricity grid in balance, wind power plant owners like all other power plants are required to undertake their power generation forecasts to the institutions responsible for the energy markets and/or transmission of the electricity of the countries. Any deviation between the observation and the forecast results in energy imbalance and it causes energy imbalance penalties for the power plant owners. Therefore, increasing the accuracy of the power generation forecasts not only prevents the large financial penalties it also contributes to energy supply security by facilitating the control of the electricity grid. In this thesis study, short-term power generation forecasts of wind power plants were covered in detail and three articles prepared about the topic have been published in the international peer-reviewed journal, Wind Engineering. In the first article, a novel hybrid day ahead wind power forecasting model that couples numerical weather prediction (NWP) model and gradient boosting machines have been proposed. While the Weather Research and Forecasting (WRF) model is used as NWP, two different WRF models have been run in the study. The first model has been run in low spatial resolution and their outputs were directly used in machine learning model training. Global Data Assimilation System (GDAS) data with a 0.25-degree spatial resolution has been used as the initial and boundary condition data for the low-resolution model. The reason for using the outputs of WRF models instead of using GDAS data directly is to increase the temporal resolution up to 10 minutes with a dynamical model instead of statistical methods. While the outputs extracted from the surrounding four grid points were used for the training of the model, a high-resolution WRF model with 333 meters of spatial resolution has also been run to compare the results of the proposed model with a well-configured WRF model. Since the study has been focused on the day-ahead wind power forecast, day-ahead forecasts of Global Forecast System (GFS) data were used in the testing of the proposed model and used as initial and boundary condition data for the WRF model. The proposed model has shown its superiority to the WRF model according to the statistical performance metrics, and improvement of 28.86%, 28.47%, and 14.8% has been reached in mean absolute error, root mean squared error, and Pearson correlation respectively. Besides its superiority in statistical metrics, the proposed model could also produce its forecasts in just 28.75 seconds after a training process which is done only once, while the WRF model requires 2.9 hours. Therefore, computational time in the operational stage of the model has also outperformed the WRF model. In the second article, a country-based wind power generation (WPG) forecast model was proposed using the CatBoost model with atmospheric variables of surface level and 700 hPa, 500 hPa, and 300 hPa pressure levels are extracted from the ERA5 data, which has 1-hour temporal and 2.5-degree spatial resolution. Twenty-six out of thirty-six different grid points which is the total grid number with 2.5 degrees to cover the entire country have been selected considering Turkey's spatial distribution of wind power plants. Besides the atmospheric variables, virtual wind turbines (VWT) have been cited on each grid point based on the wind class so that the power generation output of each VWT is calculated and used in training. Day-ahead forecasts of High Resolution (HRES) data of the European Centre for Medium-Range Weather Forecasts's (ECMWF) have been used as the test subset in this study since ERA5 and HRES resulted with the same model which is the Integrated Forecast System (IFS) of ECMWF. This also leads to a better understanding of the accuracy of the proposed forecast model. On the other hand, due to the continuous increase in Turkey's installed wind power, Turkey's hourly wind energy production was not directly used as the outcome of the model; instead, hourly production divided by total installed power was used. As in the first study, a decision tree-based machine learning algorithm, Catboost was used so that the importance of each variable was also presented. On the other hand, while feature selection (FS) methods were also included in the study; the effects of each of these methods on the model were also examined. After applying the collinearity detection in all data, Lasso, two different principal component analysis (PCA), recursive feature elimination (RFE), generalized orthogonal matching pursuit (gOMP), and forward variable elimination methods with early dropping (FBED) were used. While these methods reduce the complexity of the model by reducing the number of variables; they were also used to increase the accuracy. In addition, using the results of these FS methods; five different hybrid FS methods have also been proposed. The first of these is created by choosing the variables of the grid point that has been selected mostly by the FS methods; the remaining four select the variables selected by at least three, four, five, and six of these abovementioned six different FS methods, respectively. The fourth hybrid method has outperformed all the other methods in the study, and the normalized root mean square error and R2 were calculated as 7.6% and 0.8989, respectively. Besides, the energy production of the VWTs is selected as the most important variable, followed by wind speed and direction. In the third article, a short-term wind speed forecasting model which can predict the wind speeds of the six wind turbines of a wind farm located in the western part of Turkey from 10 minutes to 1 hour is proposed. Since this study is not focused on day-ahead forecasts and differs from the first and the second, GFS or HRES data were not used so that the forecasting has been done with the CatBoost model by using the System and Supervisory Control and Data Acquisition (SCADA) based data of the wind turbines, and the outputs of the two different WRF models have been used. While the first WRF model is configured in a single domain and National Centers for Environmental Prediction/Final (NCEP/FNL) data with a 0.25-degree spatial resolution has been used as initial and boundary condition data in that model, the outputs of the model have also 0.25-degree spatial resolution and 10 minutes time-frequency. On the other hand, the second WRF model was run to obtain the weather patterns affecting the wind farm. A VWT algorithm that has been used in the first and second studies was not used in the third article since it is aimed to forecast wind speed. Since SCADA data has outliers and missing data within, data preprocessing techniques like outlier detection, data treatment, and missing data imputation have been applied to the SCADA data before feeding the data into the model. First of all, a method in which k-means and isolation tree applications were combined to detect outliers in the data. Therefore, statistical models have been used to treat those predetermined outliers. On the other hand, the CatBoost model was used to build the relationship between WRF model outputs and SCADA data. This model has been used to impute the missing data afterward. In the study, the effects of three different data, namely SCADA, weather pattern, WRF model outputs, and the three data preprocessing techniques applied to SCADA data which are outlier detection, data treatment, and missing data imputation, on the wind speed forecast model were examined separately. Since it is aimed to forecast the wind speed of each wind turbine at 10-minute time intervals from 10 minutes to 1 hour, there were 36 variables in total to be predicted. While the best model has been chosen as the model in which all data preprocessing was performed and all different data types were used considering the statistical performance metrics, each proposed model has outperformed the simple persistence model which uses the previous time step for the next time step. On the other hand, while the air pattern that most affects Urla was calculated as purely advective with 50.76% relative frequency, the best mean absolute percentage error was obtained with 14.534% in this weather pattern. According to R2, the highest performance was seen in hybrid weather patterns with 0.9161; The lowest root mean square error and mean absolute error were observed in the pure anticyclonic weather pattern, which is usually associated with low wind speeds.

Benzer Tezler

  1. Gün öncesi elektrik piyasası için kısa dönemli rüzgar gücü üretim tahmin yöntemi

    Short-term wind power generation forecasting method for day-ahead electricity market

    EZGİ ARSLAN TUNCAR

    Doktora

    Türkçe

    Türkçe

    2024

    Elektrik ve Elektronik MühendisliğiMarmara Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    PROF. DR. ŞAFAK SAĞLAM

    PROF. DR. BÜLENT ORAL

  2. Wind energy forecasting methods: A case study of the long short term memory model (LSTM)

    Rüzgar enerjı̇sı̇ tahminı̇ yöntemleri: Uzun kısa sürelı̇ bellek modeli (LSTM) örneği

    ALI ABDULRAHMAN HUSSEIN SALIHI

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    EnerjiKırşehir Ahi Evran Üniversitesi

    Makine Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ MERDİN DANIŞMAZ

  3. Short-term forecasting of wind power production using machine learning and deep learning methods

    Makine öğrenmesi ve derin öğrenme yöntemiyle kısa dönem rüzgar gücü üretim tahmini

    FEYRUZ AKSOY

    Yüksek Lisans

    İngilizce

    İngilizce

    2018

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    Elektrik Mühendisliği Ana Bilim Dalı

    PROF. DR. ÖMER USTA

  4. Short-term wind speed and power forecasting: A comprehensive case study for three operational wind farms

    Kısa dönem rüzgâr hızı ve güç tahmini: Üç operasyonel rüzgâr tarlası için kapsamlı bir vaka çalışması

    İREM SELEN YOLDAŞ

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Enerjiİzmir Yüksek Teknoloji Enstitüsü

    Enerji Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ FERHAT BİNGÖL

  5. İleri istatistiksel yöntemler kullanarak rüzgârdan üretilen elektriksel gücün tahmini

    Wind-electric power forecast using advanced statistical methods

    SERKAN BUHAN

    Doktora

    Türkçe

    Türkçe

    2015

    Elektrik ve Elektronik MühendisliğiHacettepe Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    PROF. DR. IŞIK ÇADIRCI