Geri Dön

LSTM-based prediction of PM2.5 and PM10 air pollution: A case study of İstanbul, Turkiye

Türkiye'de PM2.5 ve PM10 hava kirliliğinin LSTM ile tahmini: İstanbul örneği

  1. Tez No: 854165
  2. Yazar: OMAR WISAM AHMED AL-QAYSI
  3. Danışmanlar: Prof. Dr. DURSUN ZAFER ŞEKER
  4. Tez Türü: Yüksek Lisans
  5. Konular: İnşaat Mühendisliği, Civil Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2024
  8. Dil: İngilizce
  9. Üniversite: İstanbul Teknik Üniversitesi
  10. Enstitü: Lisansüstü Eğitim Enstitüsü
  11. Ana Bilim Dalı: Geomatik Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Geomatik Mühendisliği Bilim Dalı
  13. Sayfa Sayısı: 75

Özet

Bu tezin amacı, istanbul'daki partikül maddesinin (PM) seviyeleriyle ilgili bir tahmin yapmak, ilgi çekici belirli kirleticiler olarak PM10 ve PM2.5 kullanmak. Bir sonraki saat için doğru tahminler üretmek amacıyla, LSTM algoritmasına dayanan modeller kullanılır. Modeller, PM10'un yaklaşık 0.87 ve PM2.5'nin 0.89 hassasiyetine ulaşmasıyla dikkat çekici bir hassaslık derecesi sergiliyor. Her iki model de olağanüstü derecede doğru. Bu açıdan bakıldığında, genel halk, özellikle solunum bozukluklarından muzdarip olanlar için zamanında uyarı yapma yeteneğinin potansiyel önemi ortaya çıkıyor. Buna ek olarak, bu modeller, sensörlerin düzgün çalışmadığı zaman bile PM seviyelerini tahmin edebilme özelliğine sahiptir. Bu, önemli bir avantaj olan sürekli izleme ve tepki stratejilerinin uygulanmasını sağlar. Araştırma sürecini başlatmak için yapılması gereken ilk şey, hava kirliliğinin halk sağlığı üzerindeki etkilerinin, partikül maddesinin yarattığı zararlı etkilere özel önem veren bir bağlam sağlamaktır. Çalışma alanı olarak seçilen İstanbul şehrinde toplam 39 hava izleme istasyonu stratejik olarak yerleştirildi. Bu istasyonlar şehrin çeşitli yerlerinde bulunur. Veri alım sürecinde NASA'dan alınan saatlik hava verileri ve Türkiye Çevre Bakanlığı'ndan alınan hava kirliliği verileri birleştirilir. Bu da işin içindedir. Ümraniye istasyonunun sunduğu kapsamlı veri, bunu modelleme amaçlı kullanma kararında önemli bir faktördü. Bu verilerde diğer kirleticilerin yanı sıra PM10 ve PM2.5 izleme işlemleri de yer alıyor. İzleme süresi Ocak 2018'den Ağustos 2023'e kadar uzanıyor. Interquartile Range yöntemi kullanılarak dışlanmaların tanımlanması ve ortadan kaldırılması sonrasında, ön işleme adımlarındaki sonraki adım K-nearest neighbors (KNN) algoritmasını kullanarak eksik değerleri doldurmaktır. Bu süreçte bir sonraki adımdır. Veriler normalleştirildikten ve eğitim, doğrulama ve test için 60-20-20 bölümüne ayrıldıktan sonra, Vanilla, Stacked ve Bidirectional olmak üzere üç farklı LSTM mimarisi farklı boyutlarda kaydırıcı giriş pencereleri kullanılarak değerlendirildi. Bu, bu mimarilerden her birinin performansını daha iyi anlamak için yapıldı. Root Mean Square Error (RMSE) 6.96 ve belirleme koeficientinin (R2) 0.871 olduğu göz önüne alındığında, bulgular Stacked LSTM modelinin diğer modellerden daha yüksek bir doğruluk seviyesi olduğu için PM10'u tahmin etme yeteneği açısından diğer modellere üstün olduğunu gösteriyor. Vanilla LSTM modeli, kök ortalama kare hatası (RMSE) değerinin 2.74 ve R2 değerinin 0.894 olduğu gibi PM2.5 için en etkili performansçıdır. Bulguların genelleştirilmesi açısından, diğer izleme merkezlerinde yapılan testlerin sonuçları cesaret verici. R2 puanları 0.77 ile 0.924 arasında değişiyordu ve RMSE değerleri 4.3 ile 13.4 arasında herhangi bir yerde olabilirdi; değerler aralığı oldukça genişti. Üsküdar istasyonu olağanüstü performansı nedeniyle özellikle dikkat çekici. Bu, en düşük RMSE ve en yüksek R2 puanları olan Vanilla ve Stacked modellerinde gözlemlenmiş olmasıyla gösteriliyor. Bu nedenle Üsküdar istasyonu özellikle dikkat çekici. Ümraniye ilçesine yakın bir konumda olduğu gerçeği, bu olağanüstü performansın olası açıklamalarından biridir. Çalışma, modellerin başarılı olduğunu kabul etmese de, aynı zamanda modellerin bazı sınırlamaları olduğunu açıkça kabul ediyor. Tahmini hava verileri, yerden ölçülen hava kirliliği verilerinin yanı sıra potansiyel önyargıları teşkil edebilir, bu da kök ortalama kare hatasının (RMSE) artışına ve belirleme koeficientinin (R2) puanlarının azalmasına yol açabilir. Bunun nedeni, tahmini hava verilerinin dahil edilmesi potansiyel önyargıları ortaya çıkaracak olasılığı olmasıdır. Çalışma, saatlik tahminleri yorumlarken dikkatli olmanın önemini de vurguluyor ve gelecekteki araştırmalar için potansiyel yollar öneriyor, örneğin daha uzun süreli tahminlerde iyileşme sağlayan çok adımlı modeller geliştirmek gibi. Ayrıca, çalışma saatlik tahminlerin yorumlanmasında dikkatli olmanın önemini vurguluyor. Buna ek olarak, öngörme modellerine bireysel faktörlerin katkısını ayırt etmek için özelliklerin önemini belirlemenin önemini vurguluyor. Bu, yukarıda bahsettiğimiz açıklamanın bağlamında yapılıyor. Özetle, İstanbul'daki PM10 ve PM2.5 için LSTM tabanlı modeller saygın bir doğruluk seviyesine sahiptir ve çevre ve halk sağlığını izlemek amacıyla değerli bilgi sağlar. Bu modeller İstanbul'da geliştirildi; onlar İstanbul'de geliştirildi. Çalışmanın bir dizi eksikliği olmasına karşın, çok adımlı modellerin ve özelliklerin öneminin analizinin gerektiğini göstererek daha fazla araştırma için bir temel oluşturuyor. Bu, daha fazla soruşturma için temel oluşturuyor. Bu çalışmanın bulguları sadece kentsel alanlarda hava kalitesini tahmin etme konusundaki tartışmaya önemli bir katkı sağlamakla kalmıyor, aynı zamanda bu çalışma alanında daha fazla ilerleme için de yol açtılar. Bunun nedeni, bu çalışmanın bulgularının daha fazla ilerleme yolunu açmasıdır.

Özet (Çeviri)

This thesis focuses on the important task of forecasting PM10 and PM2.5 levels in Istanbul. It utilizes LSTM-based models to generate precise predictions for the next hour. The models demonstrate a noteworthy level of precision, with PM10 achieving an accuracy of around 0.87 and PM2.5 achieving an accuracy of 0.89. This highlights their potential importance in providing timely alerts to the public, especially those with respiratory conditions. Moreover, these models have the additional benefit of estimating PM levels when sensors are not operational, guaranteeing continuous monitoring and response strategies. The research commences by providing a context for the influence of air pollution on public health, with a particular focus on the detrimental consequences of particulate matter (PM). Istanbul, chosen as the study area, features 39 strategically positioned air monitoring stations throughout the city. Data acquisition involves the combination of hourly weather data sourced from NASA and air pollution data obtained from the Turkish Ministry of Environment. The Ümraniye station was chosen for modeling due to its extensive data availability, which includes monitoring of PM10 and PM2.5, as well as other pollutants, from January 2018 to August 2023. The pre-processing steps involve detecting and eliminating outliers using the Interquartile Range method, and then filling in missing values using the K-nearest neighbors (KNN) algorithm. After normalizing the data and carefully dividing it into a 60-20-20 split for training, validation, and testing, three different LSTM architectures (Vanilla, Stacked, and Bidirectional) were tested using different sizes of sliding input windows. The results demonstrate that the Stacked LSTM model outperforms other models in predicting PM10, with a Root Mean Square Error (RMSE) of 6.96 and a coefficient of determination (R2) of 0.871. The Vanilla LSTM model is the best performer for PM2.5, with an RMSE of 2.74 and an R2 of 0.894. Tests conducted on other monitoring stations show promising results in terms of generalization, with R2 scores ranging from 0.77 to 0.924 and RMSE values spanning from 4.3 to 13.4. The Üsküdar station is particularly noteworthy for its exceptional performance in terms of having the lowest RMSE and the highest R2 scores, as observed in both Vanilla and Stacked models. This outstanding performance could possibly be attributed to its close proximity to the Ümraniye district. The study openly acknowledges certain limitations while acknowledging the success of the models. Incorporating estimated weather data, alongside actual ground-measured air pollution data, can introduce potential biases that may result in increased root mean square error (RMSE) and decreased coefficient of determination (R2) scores. The study also highlights the need for caution when interpreting hourly predictions and proposes future research directions, such as the creation of multi-step models to improve forecasting for longer periods of time. Moreover, it emphasizes the significance of determining feature importance in order to distinguish the precise contributions of individual factors to the prediction models. To sum up, the LSTM-based models for PM10 and PM2.5 in Istanbul show encouraging accuracy and provide important information for environmental and public health monitoring. Although the study has certain limits that exist, it establishes the basis for future research by indicating the need for multi-step models and analysis of feature importance. This research makes a valuable contribution to the overall discussion on predicting air quality in urban areas, and it paves the way for future progress in this field.

Benzer Tezler

  1. Partikül madde konsantrasyonu tahmininde derin öğrenme yaklaşımlarının karşılaştırmalı incelenmesi

    A comparative analysis of deep learning approaches for the prediction of particulate matter concentration

    İPEK AKSANGÜR

    Doktora

    Türkçe

    Türkçe

    2023

    Çevre MühendisliğiSakarya Üniversitesi

    Çevre Mühendisliği Ana Bilim Dalı

    DOÇ. DR. BEYTULLAH EREN

    DR. ÖĞR. ÜYESİ CANER ERDEN

  2. Derin öğrenme yöntemi ile hava kalitesi parametrelerinin tahmini: Sakarya örneği

    Forecasting air quality parameters by deep learning method: A case study of Sakarya

    AYŞEGÜL ATALI

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    Çevre MühendisliğiSakarya Üniversitesi

    Çevre Mühendisliği Ana Bilim Dalı

    DOÇ. DR. BEYTULLAH EREN

  3. Makine öğrenmesi teknikleri ile frezeleme işlemlerinde takım aşınmasının tahmini

    Prediction of tool wear in milling operations using machine learning techniques

    GÖKBERK SERİN

    Doktora

    Türkçe

    Türkçe

    2024

    Makine MühendisliğiTOBB Ekonomi ve Teknoloji Üniversitesi

    Makine Mühendisliği Ana Bilim Dalı

    PROF. DR. HAKKI ÖZGÜR ÜNVER

  4. Prediction of words in Turkish sentences by LSTM-based language modeling

    Türkçe cümlelerdeki kelimelerin LSTM tabanlı dil modellemesiyle tahmini

    ABDULLAH CAN ALGAN

    Yüksek Lisans

    İngilizce

    İngilizce

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik Üniversitesi

    Bilişsel Bilim Ana Bilim Dalı

    DOÇ. DR. CENGİZ ACARTÜRK

    DR. ÖĞR. ÜYESİ ÇAĞRI ÇÖLTEKİN

  5. Farklı tipteki fotovoltaik sistemlerin güç üretimlerinin analizi ve yapay zekaya dayalı tahmini

    Analysis of power generation and artificial intelligence based prediction of different types of photovoltaic systems

    TUĞBA ÖZDEMİR ALİ

    Doktora

    Türkçe

    Türkçe

    2022

    EnerjiDüzce Üniversitesi

    Fizik Ana Bilim Dalı

    PROF. DR. ÖZGE TÜZÜN ÖZMEN

    DOÇ. DR. SERHAT DUMAN