Analysis of wildfire effect on the amount of carbon monoxide emission using naive bayes
Naive bayes kullanılarak orman yangınının karbon monoksit emisyon miktarı üzerindeki etkisinin analizi
- Tez No: 962313
- Danışmanlar: PROF. DR. FİLİZ KARAMAN
- Tez Türü: Yüksek Lisans
- Konular: İstatistik, Statistics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2025
- Dil: İngilizce
- Üniversite: Yıldız Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: İstatistik Ana Bilim Dalı
- Bilim Dalı: İstatistik Bilim Dalı
- Sayfa Sayısı: 67
Özet
Orman ve arazi yangınları, atmosferik kirliliğin önemli kaynakları arasında yer almakta olup, özellikle çevre kalitesini ve halk sağlığını olumsuz etkileyen zararlı bir gaz olan karbon monoksit (CO) salınımı yoluyla bu kirliliğe katkıda bulunmaktadır. Bu çalışma, yangın faaliyetleri ile karbon monoksit seviyeleri arasındaki ilişkiyi makine öğrenmesine dayalı sınıflandırma teknikleri kullanarak araştırmaktadır. Çalışmanın amacı, atmosferik ve yangınla ilişkili göstergelere dayanarak yüksek CO emisyonlarını tahmin edebilecek bir öngörü modeli geliştirmektir. Analiz kapsamında, uydu tabanlı tarihsel veri kümeleri kullanılmış olup, CO seviyesi, kükürt dioksit (SO_2) konsantrasyonu, ozon (O_3) miktarı, yangın sıcak nokta sayısı ve yangın türü (orman veya arazi yangını) gibi değişkenler dikkate alınmıştır. Modelin zaman içinde kararlılığını ve performansını değerlendirebilmek amacıyla üç farklı dönem (2015–2018, 2016–2018 ve 2017–2018) analiz edilmiştir. Veri kümesindeki sınıf dengesizliğini gidermek için, veri sızıntısını önlemek ve gerçekçi bir model değerlendirmesi sağlamak amacıyla çapraz doğrulama döngüsü içerisinde Synthetic Minority Over-Sampling Technique (SMOTE) uygulanmıştır. Sınıflandırma işlemleri için iki algoritma karşılaştırılmıştır: Küçük veri kümelerinde basitliği ve verimliliği ile bilinen Naive Bayes ve karmaşık karar sınırları için uygun, güçlü bir Support Vector Machine (SVM) uygulaması olan SMO (Sequential Minimal Optimization). Değerlendirme kriterleri arasında doğruluk, kesinlik (precision), duyarlılık (recall), AUC (eğri altındaki alan), korelasyon ve Cohen's Kappa katsayısı yer almaktadır. Naive Bayes yönteminin, sırasıyla 2017–2018, 2016–2018 ve 2015–2018 eğitim verileri kullanılarak 2019 yılı verilerini tahmin etmedeki doğruluk oranları sırasıyla %68.18, %77.27 ve %74.24 olarak bulunmuştur. Öte yandan, SMO yönteminin aynı dönemlerdeki doğruluk sonuçları sırasıyla %86.36, %86.36 ve %72.73'tür. SMO modeli, tüm dönemlerde genel olarak Naive Bayes yöntemine kıyasla daha iyi performans göstermiştir; test aşamasında AUC değeri 0.898'e kadar ulaşmış ve maksimum kappa skoru 0.501 olarak elde edilmiştir, bu da tahmin edilen ve gerçek sınıf etiketleri arasında orta düzeyde bir uyum olduğunu göstermektedir. Naive Bayes modeli çoğu zaman yüksek duyarlılık (recall) oranlarına (%100) ulaşsa da, düşük precision değerleri, modelin pozitif sınıfları aşırı tahmin etme eğiliminde olduğunu ve bu nedenle çok sayıda yanlış pozitif sonuç ürettiğini göstermektedir. Buna karşılık, SMO modeli precision ve recall arasında daha dengeli bir performans sergileyerek, yüksek CO seviyelerinin doğru şekilde sınıflandırılmasında daha üstün ayrım gücüne sahip olduğunu ortaya koymuştur. Sonuç olarak, bu çalışma, özellikle SMO algoritması başta olmak üzere, makine öğrenmesi yöntemlerinin orman ve arazi yangınlarının çevresel etkilerinin modellenmesinde önemli bir potansiyele sahip olduğunu göstermektedir. Elde edilen sonuçlar, uydu kaynaklı atmosferik veriler ve yangın göstergelerinin, erken uyarı sistemleri, çevresel izleme ve afet risk yönetimi için tahmine dayalı sistemlerin geliştirilmesinde etkin şekilde kullanılabileceğini desteklemektedir.
Özet (Çeviri)
Wildfires are significant contributors to atmospheric pollution, particulary through the release of carbon monoxide (CO), a harmful gas that affects both environmental quality and public health. This study investigates the relationship between wildfire activity and CO levels using machine learning-based classification techniques. The aim is to develop a predictive model capable of identifying elevated CO emissions based on a set of atmospheric and fire-related indicators. The analysis utilizes historical satellite-based datasets, including variables such as CO level, sulfur dioxide (SO_2) concentration, ozone (O_3) concentration, the number of fire hotspots, and the type of fire (and or forest fire). Three different temporal windows were evaluated, namely 2015-2018, 2016-2018, and 2017-2018, to assess model stability and performance over varying data ranges. To address class imbalance in the dataset, the Synthetic Minority Over-Sampling Technique (SMOTE) was applied within the cross-validation loop to prevent data leakage and ensure robust model evaluation. Two classification algorithms were compared. Naive Bayes, which is known for its simplicity and efficiency on small datasets, and SMO (Sequential Minimal Optimization), a powerful implementation of Support Vector Machines (SVMs) suited for complex decision boundaries. Evaluation metrics included accuracy, precision, recall, are under the curve (AUC), correlation, and Cohen's Kappa coefficient. The results showed that the accuracy results of the Naive Bayes method for 2017-2018, 2016-2018, and 2015-2018 training data in predicting 2019 data are 68.18%, 77.27%, and 74.24% respectively. Meanwhile, the accuracy results of the SMO method are 86.36%, 86.36%, and 72.73% respectively. The SMO model mostly outperformed Naive Bayes across all time periods, with testing AUC values reaching up to 0.898, and a maximum kappa score of 0.501, indicating moderate agreement between predicted and actual class labels. Although Naive Bayes achieved high recall values (often 100%), its precision remained low, reflecting a tendency to over-predict positive cases and thus generate a high number of false positives. Conversely, SMO demonstrated a better balance between precision and recall, indicating superior discriminative power in identifying true positive cases of elevated CO levels. In conclusion, this study highlights the potential of machine learning methods, particulary SMO, in modeling the environmental effects of forest and land fires. The results support the use of satellite-derived atmospheric data and fire indicators for building predictive systems that can aid in early detection, environmental monitoring, and disaster risk management.
Benzer Tezler
- Mobilya endüstrisinde yaşam döngüsü analizi yaklaşımı ile çevreci tasarım ve sürdürülebilir stratejiler
Eco-design and sustainable strategies for the furniture industry through life cycle approach
MERVE MERMERTAŞ
Yüksek Lisans
Türkçe
2018
Çevre Mühendisliğiİstanbul Teknik ÜniversitesiÇevre Mühendisliği Ana Bilim Dalı
PROF. DR. FATMA GERMİRLİ BABUNA
- Türkiye'de orman yangınlarının güneş lekeleri ile olası ilişkisinin araştırılması
Investigation of possible relation of forest fires with sunspots in Türkiye
NEZİHA ANĞINOĞLU
Yüksek Lisans
Türkçe
2024
Ormancılık ve Orman MühendisliğiSakarya ÜniversitesiAfet Yönetimi Ana Bilim Dalı
PROF. DR. MURAT UTKUCU
- Understanding the dynamics of air pollution during forest fires in Antalya-Manavgat: A WRF-CHEM analysis
Antalya-Manavgat'ta orman yangınlarında hava kirliliğinin dinamiklerini anlamak: WRF-CHEM analizi
YİĞİTALP KARA
Yüksek Lisans
İngilizce
2024
Meteorolojiİstanbul Teknik ÜniversitesiMeteoroloji Mühendisliği Ana Bilim Dalı
PROF. DR. HÜSEYİN TOROS
- Fire history and climate change: Black pine forests in Western Anatolia
Batı Anadolu'daki karaçam ormanlarının yangın tarihi ve iklim değişikliği
EVRİM AYŞE ŞAHAN
Doktora
İngilizce
2022
Ormancılık ve Orman Mühendisliğiİstanbul Teknik Üniversitesiİklim ve Deniz Bilimleri Ana Bilim Dalı
PROF. DR. HASAN NÜZHET DALFES
PROF. DR. NESİBE KÖSE
- Büyük orman yangını geçirmiş alanlarda yersel ölçüm ve serpinti radyonüklid yöntemleri (Berilyum-7 ve Sezyum-137) kullanılarak toprak erozyonu hızının belirlenmesi
Determination of erosion rate in wildfire areas using field measurement and fallout radionuclides (Beryllium-7 and Caesium-137) methods
CİHAN YILDIZ
Doktora
Türkçe
2023
Coğrafyaİstanbul Teknik ÜniversitesiKatı Yer Bilimleri Ana Bilim Dalı
PROF. DR. TOLGA GÖRÜM