Makine öğrenmesi yöntemleriyle orman yangını tahmini
Forest fire prediction with machine learning methods
- Tez No: 800735
- Danışmanlar: DR. ÖĞR. ÜYESİ FARUK BATURALP GÜNAY
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: orman yangını, makine öğrenmesi, özellik seçme, sınıflandırma, karışıklık matrisi, forest fire, prediction, machine learning, feature selection, classification
- Yıl: 2023
- Dil: Türkçe
- Üniversite: Atatürk Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 78
Özet
Amaç: Bu tez çalışmasının amacı; makine öğrenmesi yöntemleriyle orman yangını tahmini modeli geliştirilerek olası orman yangınlarının önceden tahmin edilmesini sağlamaktır. Orman yangınlarının önceden tahmin edilebilir olmasıyla erken müdahale sağlanarak yangınların kontrol altına alınması ve etkilerinin azaltılması hedeflenmiştir. Orman yangınlarını etkileyen ana faktörlerden meteorolojik ve topografik yapı gibi özelliklerin bulunduğu veri seti kullanılarak ikili sınıflandırma ile yangın tahmin modeli geliştirilmiştir. Yöntem: Bu tez çalışmasında, orman yangını tahmin modeli için kullanılan veri seti, NASA'nın Oak Ridge Ulusal Laboratuvarı (ORNL) Dağıtılmış Aktif Arşiv Merkezi'nin (DAAC) resmi web sayfasından alınmıştır. Veriler, ön işleme adımlarından geçirilerek gereksiz verilerin silinmesi, eksik verilerin tamamlanması, normalizasyon gibi çeşitli işlemlere tabi tutulmuştur. Veri setinde girdi öznitelik sayısını azaltmak için öznitelik seçme teknikleri kullanılarak hedef değişkeni bulmada en önemli ve en faydalı öznitelikler belirlenerek ikili sınıflandırma işlemi gerçekleştirilmiştir. Makine öğrenmesi algoritmalarından Destek Vektör Makinesi (DVM), Karar Ağacı (KA), Rasgele Orman (RO), Gradyan Artırma (GA), K-En Yakın Komşu (KNN) ve Naive Bayes (NB) olmak üzere 6 farklı sınıflandırma algoritmaları ile 10 kat çapraz doğrulama uygulanarak modeller oluşturulmuştur. Geliştirilen modellerin performanslarını ölçmek için literatürde yaygın olarak kullanılmakta olan karışıklık matrisin'den elde edilen doğruluk, duyarlılık, kesinlik, f1-skoru ölçüleri ile ROC eğrisinden yararlanılmıştır. Bulgular: Bu tez çalışmasında temel veri seti üzerinde ve özellik seçimi sonrası belirlenen değişkenlerden oluşan veri setiyle makine öğrenmesi algoritmaları kullanılarak orman yangın tahmin (yangın var-1, yangın yok-0) durumu sınıflandırılmıştır. Özellik seçim yöntemlerinden Varyans eşiği ile 35 özelliğe sahip veri seti 15'e indirgenmiş ve sınıflandırma sonucu en yüksek doğruluk oranına %97 ile RO algoritmasıyla ulaşılmıştır. ANOVA ile 35 özelliğe sahip veri seti 11'e indirgenmiş ve sınıflandırmada en yüksek doğruluk oranı %97 olarak RO ile elde edilmiştir. Ki-kare testi yöntemiyle veri setinin özellik sayısı 35'ten 11'e indirgenmiş ve en yüksek doğruluk oranı %97 olarak RO, KA ve GA algoritmalarıyla elde edilmiştir. Son olarak PCA yöntemiyle ise 35 özelliğe sahip veri seti 11'e indirgenmiş ve RO algoritması doğruluk (%96), AUC (%99) ve diğer performans metriklerinde en yüksek değeri vermiştir. Çalışma süreleri bakımında ise KA ve NB algoritması RO'ya göre daha kısa sürede işlemlerini tamamladığı görülmüştür. Sonuç: Bu çalışmada geçmiş orman yangınları verileriyle makine öğrenmesi algoritmaları kullanılarak orman yangın tahmini modeli geliştirilmiştir. Tüm yöntemler için test veri seti üzerinden her bir algoritmayla oluşturulan modele ait karışıklık matrisinden elde edilen performans ölçütleri karşılaştırılarak analiz edilmiştir. Orman yangını tahminde her bir veri setinde en iyi sınıflandırma başarısını sağlayan modelin RO algoritması olduğu, çalışma süresi bakımından ise RO'ya göre NB ve KA'nın daha kısa sürede işlemlerini tamamladığı gözlemlenmiştir.
Özet (Çeviri)
Purpose: The aim of this thesis study; The aim is to develop a forest fire prediction model with machine learning methods and to predict possible forest fires. It is aimed to control the fires and reduce their effects by providing early intervention with the predictability of forest fires. A fire prediction model with binary classification was developed using the data set, which includes features such as meteorological and topographic structure, which are the main factors affecting forest fires. Method: In this thesis, the dataset used for the wildfire prediction model was taken from the official web page of NASA's Oak Ridge National Laboratory (ORNL) Center for Distributed Active Archives (DAAC). The data were subjected to various processes such as deletion of unnecessary data, completion of missing data, and normalization by passing through pre-processing steps. In order to reduce the number of input features in the data set, the most important and most useful features in finding the target variable were determined by using feature selection techniques and binary classification was performed. 6 different classification algorithms from machine learning algorithms: Support Vector Machine (SVM), Decision Tree (DT), Random Forest (RF), Gradient Boost (GB), K-Nearest Neighbor (K-NN) and Naive Bayes (NB) Models were created by applying 10-fold cross validation with. In order to measure the performance of the developed models, accuracy, sensitivity, precision, f1-score measures and ROC curve obtained from the confusion matrix, which is widely used in the literature, were used. Findings: In this thesis, forest fire prediction (fire -1, no fire-0) situation was classified by using machine learning algorithms with the data set consisting of the variables determined on the basic data set and after feature selection. One of the feature selection methods, the data set with 35 features was reduced to 15 with the variance threshold, and the highest accuracy rate of the classification result was achieved with a RF with 97%. The data set with 35 features was reduced to 11 with ANOVA and the highest accuracy rate in classification was obtained with RF as 97%. With the chi-square test method, the number of features of the data set was reduced from 35 to 11 and the highest accuracy rate of 97% was obtained with RF, DT and GB algorithms. With PCA, the dataset with 35 features was reduced to 11 and the RF algorithm gave the highest value in accuracy (96%), AUC (99%) and other performance metrics. In terms of working times, it has been seen that DT and NB algorithms complete their operations in a shorter time than RF. Results: In this study, a forest fire prediction model was developed by using machine learning algorithms with data from past forest fires. For all methods, the performance measures obtained from the confusion matrix of the model created with each algorithm over the test data set were compared and analyzed. It has been observed that the model that provides the best classification success in each data set in forest fire prediction is the RF algorithm, and in terms of working time, NB and DT complete their operations in a shorter time compared to RF.
Benzer Tezler
- Makine öğrenmesi metotları kullanılarak orman yangınlarının tahmini: Türkiye'de vaka çalışması
Prediction of forest fires using machine learning methodology: A case study in Türkiye
BETÜL ARSLAN
Yüksek Lisans
Türkçe
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Üniversitesi-CerrahpaşaBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. DERYA YILTAŞ KAPLAN
- Orman ekosistemlerindeki biyotik ve abiyotik zararların otomatik makine öğrenmesi ile modellenmesi: İzmir Orman Bölge Müdürlüğü örneği
Modelling of biotic and abiotic disturbances in forest ecosystems with automated machine learning: The case of İzmir Forest Regional Directorate
KAMBER CAN ALKİŞ
Yüksek Lisans
Türkçe
2023
Ormancılık ve Orman Mühendisliğiİzmir Katip Çelebi ÜniversitesiOrman Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ REMZİ EKER
- Veri analiz yöntemlerine dayalı olarak orman yangınlarının incelenmesi
Investigation of forest fires based on data analysis methods
ZEYNEP AYTOLU KÜLAHCİ
Yüksek Lisans
Türkçe
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Aydın ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. ZAFER ASLAN
- Optimization of deep neural network architectures for the forest fire detection
Orman yangini tespitinde derin sinir aği mimarilerinin optimizasyonu
BERRİN SAVDA
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
PROF. DR. MÜŞTAK ERHAN YALÇIN
PROF. DR. HAZIM KEMAL EKENEL
- Geopolimer betonun yangın dayanımının makine öğrenmesi algoritmaları kullanılarak modellenmesi
Modelling the fire resistance of geopolymer concrete via machine learning algorithms
MUHAMMED KAYA
Yüksek Lisans
Türkçe
2023
İnşaat MühendisliğiIğdır Üniversitesiİnşaat Mühendisliği Ana Bilim Dalı
DOÇ. DR. AHMET EMİN KURTOĞLU
DR. ÖĞR. ÜYESİ NECİP ALTAY EREN