Geri Dön

A comparative analysis of LSTM and lıghtgbm models in short-term electricity load forecasting: a case study from türkiye

Kısa dönemli yük tahmininde LSTM ve lightgbm modellerinin karşılaştırmalı analizi: Türkiye'den bir vaka çalışması

  1. Tez No: 953769
  2. Yazar: MUHAMMET FURKAN BAYSAL
  3. Danışmanlar: DR. ÖĞR. ÜYESİ MUSTAFA BERKER YURTSEVEN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Enerji, Energy
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2025
  8. Dil: İngilizce
  9. Üniversite: İstanbul Teknik Üniversitesi
  10. Enstitü: Lisansüstü Eğitim Enstitüsü
  11. Ana Bilim Dalı: Enerji Bilim ve Teknoloji Ana Bilim Dalı
  12. Bilim Dalı: Enerji Bilim ve Teknoloji Bilim Dalı
  13. Sayfa Sayısı: 125

Özet

Dünya genelinde elektrik enerjisi kullanımı hızlı bir artış göstermektedir. Elektriğe duyulan ihtiyacın, teknolojik gelişmeler ve bu teknolojilere olan bağımlılığın artmasıyla birlikte önümüzdeki yıllarda daha da büyümesi beklenmektedir. Bu durum, elektrik üretimi, iletimi ve tüketimi süreçlerinde daha verimli ve sürdürülebilir çözümlere olan ihtiyacı artırmaktadır. Elektrik enerjisinin büyük ölçeklerde ekonomik ve teknik olarak depolanmasının sınırlı olması nedeniyle, üretim ve tüketimin gerçek zamanlı olarak dengelenmesi hayati bir öneme taşımaktadır. Elektrik piyasaları sistemin teknik açıdan istikrarlı ve güvenilir bir şekilde işletilmesini sağlamak ve arz-talep dengesini gerçek zamanlı olarak kurmak amacıyla yapılandırılmıştır. Bu çerçevede, elektrik piyasası elektriğin fiziksel teslimatından önce arz-talep dengesini sağlamak amacıyla farklı alt piyasalara ayrılmıştır. Türkiye elektrik piyasasında temel alt piyasalar; gün öncesi piyasası, gün içi piyasası ve dengeleme güç piyasasıdır. Gün öncesi piyasasında, hem arz hem de talep tarafı bir gün öncesinden tahminlerini piyasa işletmecisine iletmek zorundadır. Gün içi piyasası ise, gün öncesinde yapılan tahminlerde sapma olması durumunda teslimattan bir saat öncesine kadar sistemin dengelenmesine olanak tanır. Bu mekanizmaların tamamının sağlıklı işletilmesi, yük tahminlerinin doğruluğuna bağlıdır. Aksi takdirde, sistemde oluşan dengesizlikler yüksek dengesizlik maliyetlerine ve sistem güvenilirliği açısından ciddi risklere yol açmaktadır. Bu nedenle, kısa dönemli elektrik yük tahminlerinin güvenilir ve zamanında yapılması büyük önem arz etmektedir. Bu tez çalışmasında, Türkiye'nin belirli bir elektrik dağıtım bölgesine ait trafo merkezlerinden elde edilen gerçek saatlik yük verileri kullanılarak kısa dönemli (saatlik) elektrik yük tahmini gerçekleştirilmiştir. Çalışmada kullanılan elektrik yük verileri 2022-2024 yılları arasındaki üç yıllık dönemi kapsamaktadır ve toplamda yaklaşık 26.000 saatlik gözlemden oluşmaktadır. Söz konusu yük verisi, ilgili bölgeye trafo merkezleri aracılığıyla giren toplam elektrik enerjisini temsil etmekte olup; bölgedeki tüketimin yanı sıra teknik ve teknik olmayan kayıpları da içermektedir. Dolayısıyla, yük verisi tüketimle doğrudan ilişkili olsa da, tüketimi birebir yansıtmayabilir. Saatlik yük verisine ek olarak elektrik tüketimi ile meteorolojik faktörler arasındaki ilişkinin literatürde birçok çalışmada ele alınmış olması nedeniyle, bu çalışmada da sıcaklık, bağıl nem ve rüzgar hızı gibi değişkenler veri setine dahil edilmiştir. Söz konusu meteorolojik veriler NASA POWER platformundan saatlik bazda temin edilmiş ve yük verileriyle eşleştirilmiştir. Çalışmada kullanılan bölgesel yük verisinin Türkiye'nin belirli bir dağıtım bölgesine ait özgün yük desenleri taşıması nedeniyle, kapsamlı bir açıklayıcı veri analizi gerçekleştirilmiştir. Zaman içerisindeki değişimleri incelemek amacıyla yapılan analizler, elektrik yükünde mevsimsel dalgalanmalar olduğunu ve genel olarak artan bir eğilim sergilediğini ortaya koymuştur. Ayrıca, zaman serisi analizleri verinin durağan olmadığını göstermiştir. Bu doğrultuda, veri ön işleme aşamasında kapsamlı bir özellik mühendisliği süreci uygulanmıştır. İlk olarak tarih sütunundan türetilen ay, hafta, gün ve saat gibi zaman temelli değişkenler türetilmiş ve bu değişkenlere sinüs-kosinüs dönüşümleri uygulanarak modellerin dönemsel desenleri daha etkili şekilde öğrenmesi hedeflenmiştir. Geçmiş yük bilgilerini modele dahil etmek amacıyla 24 ila 240 saat aralığındaki gecikmeli (lag) değişkenler oluşturulmuş; ayrıca 24 ila 720 saatlik pencere boyutları kullanılarak hareketli ortalama ve farklı smoothing katsayılarına sahip üstel ağırlıklı hareketli ortalama (EWMA) değişkenleri veri setine dahil eklenmiştir.Resmi tatil ve hafta sonu bilgileri ise kategorik değişken olarak tanımlanmıştır. Lag değişkenlerin oluşturulması sürecinde oluşan eksik gözlemler interpolasyon yöntemiyle tamamlanmıştır. Tüm bu değişkenlerin farklı aralıklarda değerler içermesi nedeniyle, modelin daha dengeli bir şekilde öğrenmesini sağlamak amacıyla MinMaxScaler yöntemi ile standardizasyon uygulanmıştır. Model geliştirme sürecinin sağlıklı yürütülebilmesi adına veri seti üç alt kümeye ayrılmıştır: Eğitim seti 1 Ocak 2022 ile 31 Aralık 2023 tarihlerini kapsamış, doğrulama seti ise 2024 yılının ilk altı ayında kullanılmıştır. Bu doğrulama seti, hiperparametre optimizasyonu ve model seçimi süreçlerinde değerlendirilmiş; son olarak, modellerin genellenebilirliğini ve tahmin doğruluğunu test etmek amacıyla 2024 yılının ikinci yarısındaki veriler test seti olarak kullanılmıştır. Bu çalışmada, farklı yapısal özelliklere sahip iki model tercih edilmiştir: geleneksel bir makine öğrenmesi algoritması olan Light Gradient Boosting Machine (LightGBM) ve derin öğrenme tabanlı Long Short-Term Memory (LSTM) modeli. Bu iki model, zaman serisi verileri üzerinde öne çıkan farklı güçlü yönleri nedeniyle seçilmiştir. LSTM modeli, zaman serilerindeki uzun dönemli bağımlılıkları yakalama kapasitesiyle; LightGBM ise düşük hesaplama süresi, yorumlanabilirliği ve küçük veri setlerinde gösterdiği yüksek performansla bilinmektedir. Model geliştirme sürecinde, LightGBM için GridSearchCV yöntemiyle; LSTM için ise TensorFlow ve Keras kütüphaneleri hiperparametre optimizasyonu gerçekleştirilmiştir. Modeller, doğruluklarını artıracak şekilde en uygun parametrelerle yapılandırılmıştır. Model parformansları yalnızca genel doğrulukla sınırlı kalmayıp; saatlik, günlük, aylık ve özel günler (hafta sonu, resmi tatil) gibi farklı zaman dilimlerinde gösterdikleri başarı düzeyleri üzerinden detaylı biçimde analiz edilmiştir. Model performansı; RMSE, MAE, MAPE, MSE gibi çeşitli hata metrikleriyle değerlendirilmiştir. Performans analizleri zaman bazlı olarak da yapılmış; saatlik, günlük, aylık ve özel günler özelinde başarı düzeyleri detaylandırılmıştır. Genel doğruluk açısından LightGBM modelinin daha başarılı sonuçlar verdiği görülmüştür. R² değeri LightGBM için 0.9254, LSTM için ise 0.9143 olarak hesaplanmıştır. Aylık bazda en düşük MAPE değeri Ocak ayında LSTM modeliyle (%2.25), Ekim ayında ise LightGBM ile (%2.24) elde edilmiştir. Günlük bazda LightGBM hafta içi günlerde LSTM'e kıyasla daha başarılı olurken (MAPE %3.36'ya karşı %3.70), hafta sonlarında LSTM daha dengeli sonuçlar vermiştir. Saatlik bazda ise her iki modelin 03:00–05:00 saat diliminde daha yüksek doğruluk oranlarına ulaştığı görülmüştür. Tatil günlerinde LightGBM %7.66 MAPE ile daha düşük hata verirken, LSTM %9.95 MAPE ile yaklaşık %30 daha fazla hata yapmıştır. Ayrıca, LightGBM modelinin düşük hesaplama süresi sayesinde pratik uygulamalara daha uygun olduğu belirlenmiştir. Özellik mühendisliğiyle eklenen değişkenlerin model başarısına etkisini analiz etmek amacıyla, modeller bu değişkenler olmadan da eğitilmiş ve karşılaştırma yapılmıştır. LightGBM için R² skorunun 0.6449'dan 0.9254'e yükselmesi, zaman temelli değişkenlerin model performansına sağladığı katkıyı net biçimde ortaya koymuştur. Özellik önem analizi sonucunda, modele en fazla katkıyı sağlayan değişkenin bir hafta önceki yük verisi olduğu belirlenmiş (%29.06). Bunu bir hafta önceki EWMA (%17.07) ve bir gün önceki EWMA (%10.31) izlemiştir. Bu sonuç, geçmiş yük bilgileri ile oluşturulan lag ve ağırlıklı ortalama değişkenlerinin, kısa dönemli tahminlerde temel belirleyici olduğunu göstermektedir. Ayrıca tatil günlerini temsil eden değişkenin de %3.58 katkı sağladığı görülmüştür. Sonuç olarak bu çalışma; Türkiye elektrik piyasasına ait gerçek bölgesel veriler kullanılarak gerçekleştirilmiş olması, zaman duyarlı model başarımı analizi içermesi ve kapsamlı bir özellik mühendisliği sürecine yer vermesi bakımından literatüre katkı sunmaktadır. Özellikle geçmiş yük örüntülerini temsil eden lag ve EWMA değişkenlerinin bir arada kullanılması, tahmin doğruluğunu önemli ölçüde artırmıştır. Ayrıca, geleneksel makine öğrenmesi yöntemlerine zaman farkındalığı kazandırılarak, bu modellerin derin öğrenme algoritmalarıyla rekabet edebilecek düzeye ulaşabildiği gösterilmiştir. Gelecek çalışmalarda farklı bölgelerde benzer analizlerin yapılması, modellerin gerçek zamanlı sistemlere entegrasyonu, farklı derin öğrenme mimarilerinin denenmesi ve hibrit modellerin geliştirilmesi gibi konuların araştırılması önerilmektedir.

Özet (Çeviri)

Electricity consumption is increasing rapidly around the world due to technological progress and the rising dependence on electricity-driven systems. Since large-scale electricity storage solutions are still costly and limited, maintaining real-time balance between supply and demand has become essential. In this context, electricity markets have been established not only to ensure system stability but also to support transparent price formation, resource efficiency, energy security, and fair competition. One of the key tools for supporting system operations and reducing imbalance costs is short-term electricity load forecasting. This thesis focuses on short-term electricity load forecasting for a specific distribution region in Türkiye. The forecasting models are developed using real hourly load data collected from local transformer stations. The dataset covers the years 2022 to 2024 and consists of approximately 26,000 hourly records. As electricity load is highly affected by weather conditions, hourly meteorological data such as temperature, relative humidity, and wind speed were obtained from the NASA POWER platform and matched with the corresponding load values. Two advanced forecasting models were developed and compared: Light Gradient Boosting Machine (LightGBM), a machine learning algorithm, and Long Short-Term Memory (LSTM), a deep learning model designed for sequential data. These models were selected due to their proven success in capturing temporal patterns in electricity load data. While LSTM is capable of modeling long-term dependencies, LightGBM is faster to train and more interpretable. Both models were evaluated not only in terms of general accuracy but also across multiple time scales, including hourly, daily, and monthly levels, as well as performance differences between weekdays, weekends, and public holidays. Before model training, extensive exploratory data analysis was conducted to examine seasonal patterns, detect trends, and evaluate the distribution of key variables. The findings indicated a significant rise in electricity usage during summer months, especially in July and August. Time series analysis showed that the data was non-stationary and exhibited a long-term upward trend. A detailed feature engineering process was then applied, including time-based variables (month, day, hour), sine-cosine transformations for cyclical features, lagged values ranging from 24 to 240 hours, rolling means, and exponentially weighted moving averages (EWMA). Holiday and weekend indicators were also added to increase model awareness of temporal effects. To ensure robust evaluation, the dataset was divided into training (January 2022 – December 2023), validation (January – June 2024), and testing (July – December 2024) subsets. After hyperparameter tuning on the validation set, the final models were retrained using the full training data and then tested on the unseen test set. Additionally, to verify the stability of the models and prevent overfitting, cross-validation procedures with different random seeds were applied. These steps helped confirm the generalizability and consistency of the forecasting performance. GridSearchCV was used to optimize key LightGBM parameters, such as learning rate, tree depth, and number of leaves. The LSTM model was implemented using TensorFlow and Keras libraries, and its architecture was optimized by adjusting the number of layers, hidden units, optimizer type, window size, and step size. The performance of both models was assessed using RMSE, MAE, MAPE, MSE, and R² metrics. Overall, LightGBM slightly outperformed LSTM, with an R² value of 0.9254 compared to 0.9143 for LSTM. On a monthly basis, the lowest MAPE was observed in January with LSTM (2.25%) and in October with LightGBM (2.24%). LightGBM also performed better on weekdays and public holidays, while LSTM showed more stable results on weekends. These findings highlight the practical strengths of both models depending on the operational context. The added value of feature engineering was further confirmed by comparing models trained with and without engineered features. For LightGBM, R² increased from 0.6449 to 0.9254 when time-based variables were included. Feature importance analysis revealed that the most influential predictor was the electricity load from 168 hours earlier (lag_168), contributing 29.06% to the model's decision process, followed by EWMA features with 168-hour and 24-hour lags. In conclusion, this study demonstrates the effectiveness of advanced machine learning and deep learning methods in improving the accuracy of electricity load forecasts. It also provides a structured methodology for model validation, feature engineering, and performance assessment in real-world energy forecasting tasks. These results can support operational planning, reduce imbalance costs, and contribute to more efficient and sustainable electricity systems.

Benzer Tezler

  1. Yapay zeka yardımıyla güneş enerjisi üretim tahminlemesi ve gerçekleşen üretim değerleri ile tasarım programı çıktılarının karşılaştırmalı analizi

    Solar energy production estimation with the help of artificial intelligence and comparative analysis of realized production values and design program outputs

    GAMZE MERSİN

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolEge Üniversitesi

    Güneş Enerjisi Ana Bilim Dalı

    PROF. DR. MELİH SONER ÇELİKTAŞ

  2. Siber açıkların tespit edilmesi amacıyla bir uygulamanın geliştirilmesi ve siber saldırı senaryolarının incelenmesi: Türkiye örneği

    Development of an application for the detection of cyber vulnerabilities and examination of cyber attack scenarios: The case of Turkiye

    MEHMET ALİ TEKELİ

    Yüksek Lisans

    Türkçe

    Türkçe

    2025

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSelçuk Üniversitesi

    Bilişim Teknolojileri Mühendisliği Ana Bilim Dalı

    PROF. DR. FATİH BAŞÇİFTÇİ

    DOÇ. DR. EMRE AVUÇLU

  3. IoT ağları için yeni bir saldırı tespit sistemi tasarımı

    Design of a new intrusion detection system for IoT networks

    TUĞBA ULUSOY

    Yüksek Lisans

    Türkçe

    Türkçe

    2025

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSakarya Üniversitesi

    Bilgisayar ve Bilişim Mühendisliği Ana Bilim Dalı

    PROF. DR. ÜNAL ÇAVUŞOĞLU

  4. RPL tabanlı lot ağlarında saldırı tespiti ve sınıflandırılması

    Attack detection and classification in RPL-based iot networks

    AHMET NAİL TAŞTAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2025

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Gelişim Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ SERKAN GÖNEN

    DR. ÖĞR. ÜYESİ GÖKÇE KARACAYILMAZ

  5. A comparatıve analysıs of LSTM and XGBoost methods for day ahead electrıcıty prıce forecastıng

    Gün öncesi elektrik fiyatı öngörüsü için LSTM ve XGBoost yöntemlerinin karşılaştırmalı analizi

    CAHİT URAL KÜKNER

    Yüksek Lisans

    İngilizce

    İngilizce

    2020

    Enerjiİstanbul Teknik Üniversitesi

    Enerji Bilim ve Teknoloji Ana Bilim Dalı

    PROF. DR. AHMET DURMAYAZ