Makine öğrenmesi algoritmalarının performans analizi: Simülasyon ve orman yangını verisi üzerinde uygulama
Performance analysis of machine learning algorithms: A simulation-based study and an application on forest fire data
- Tez No: 967234
- Danışmanlar: DOÇ. DR. ESRA GÖKPINAR
- Tez Türü: Yüksek Lisans
- Konular: İstatistik, Statistics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2025
- Dil: Türkçe
- Üniversite: Gazi Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: İstatistik Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 86
Özet
Makine öğrenmesi, bilgisayarların verilerden öğrenmesini ve bu verilerle anlamlı tahminler, sınıflandırmalar yapmasını sağlayan bir yapay zekâ alanıdır. Bu alandaki algoritmalar, örüntü tanıma, veri analizi ve öngörüde bulunma gibi işlemleri gerçekleştirebilme yeteneği sayesinde pek çok farklı uygulama alanında kullanılmaktadır. Bu tez çalışmasında, Python programlama dili kullanılarak makine öğrenmesi algoritmalarının farklı veri dağılımları altında nasıl performans gösterdiğini incelemek ve orman yangınlarını önceden tahmin etmek ve hızlı müdahaleye olanak sağlamayı amaçlanmıştır. Bu doğrultuda, öncelikle simülasyon çalışmalarıyla çeşitli veri dağılımlarından üretilen yapay veri setlerinde sınıflandırma algoritmalarının performansları karşılaştırılmıştır. Sonuçlar, model performanslarının veri setinin dağılımsal özelliklerine ve sınıf dengesine göre değiştiğini ortaya koymaktadır. Lojistik Regresyon, Naive Bayes ve Destek Vektör Makineleri normal dağılımlarda yüksek performans sergilerken, normal olmayan dağılımlarda ağaç tabanlı yöntemler daha başarılı sonuçlar vermiştir. Ayrıca bir uygulama üzerinde de bu modellerin performanslarına bakılmıştır. Buna göre T.C. Tarım ve Orman Bakanlığı tarafından sağlanan, yangın tahminini etkileyen meteorolojik, topografik ve bitki örtüsü gibi değişkenleri içeren bir veri seti üzerinde kapsamlı ön işleme adımları gerçekleştirilmiştir. Hiper parametre optimizasyonu ile modeller eğitilmiş ve performansları değerlendirilmiştir. Veri seti üzerinde hem genel bir model eğitimi hem de bölge bazında model eğitimleri gerçekleştirilmiştir. Türkiye geneli model performans sonuçlarına göre, Rastgele Orman, XGBoost ve Gradient Boosting algoritmaları en yüksek performansı göstermiştir. Bölgesel analizlerde ise en başarılı modellerin bölgelere göre değiştiği gözlemlenmiştir.
Özet (Çeviri)
Machine learning is a field of artificial intelligence that enables computers to learn from data and make meaningful predictions and classifications with this data. Algorithms in this field are used in many different application areas thanks to their ability to perform operations such as pattern recognition, data analysis and prediction. In this thesis, it is aimed to examine how machine learning algorithms perform under different data distributions using Python programming language and to predict forest fires and enable rapid intervention. In this direction, firstly, the performances of classification algorithms on artificial data sets generated from various data distributions were compared through simulation studies. The results show that model performances vary according to the distributional characteristics of the data set and class balance. While Logistic Regression, Naive Bayes and Support Vector Machines showed high performance in normal distributions, tree-based methods gave better results in non-normal distributions.The performances of these models were also analysed on an application. Accordingly, extensive pre-processing steps were performed on a data set provided by the Ministry of Agriculture and Forestry, which includes variables such as meteorological, topographic and vegetation cover affecting fire prediction. The models were trained with hyper parameter optimisation and their performances were evaluated. Both a general model training and region-based model training were performed on the data set. According to Turkey-wide model performance results, Random Forest, XGBoost and Gradient Boosting algorithms showed the highest performance. In regional analyses, it has been observed that the most successful models vary from region to region.
Benzer Tezler
- Sağdan sansürlü sağkalım analizinde makine öğrenmesinde sınıflandırma algoritmaların kullanımı
Using of classification algorithms in machine learning for right censored survival analysis
PELİN AKIN
Doktora
Türkçe
2020
İstatistikOndokuz Mayıs Üniversitesiİstatistik Ana Bilim Dalı
PROF. DR. YÜKSEL TERZİ
- Kronik hepatit C hastalığı risk belirlenmesinde sıralı lojistik regresyon ve makine öğrenme algoritmalarının sınıflama performansının karşılaştırılması
Comparison of classification performance of ordinal logistic regression and machine learning algorithms for risk determination of chronic hepatitis C disease
ALİ VASFİ AĞLARCI
Doktora
Türkçe
2022
BiyoistatistikEskişehir Osmangazi ÜniversitesiBiyoistatistik Ana Bilim Dalı
DOÇ. DR. CENGİZ BAL
- İklimlendirme sistemleri üzerinde makine öğrenmesi ile anomali tespiti
Anomaly detection with machine learning on air conditioning systems
REFİK KİBAR
Yüksek Lisans
Türkçe
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSakarya ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ MUHAMMED FATİH ADAK
DR. ÖĞR. ÜYESİ KEVSER OVAZ AKPINAR
- Açık uçlu eşeksenel prob ile dielektrik spektroskopi için makine öğrenmesi temelli kestirim yöntemleri
Machine learning based estimation methods for dielectric spectroscopy with open-ended coaxial probe
MUSA ALPEREN YILMAZ
Yüksek Lisans
Türkçe
2024
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
PROF. DR. MEHMET ÇAYÖREN
- Irregular longitudinal data analysis with statistical and machine learning methods in asteroid dataset
Asteroid veri kümesinde istatistiksel ve makine öğrenme yöntemleriyle düzensiz boylamsal veri analizi
İREM TANRIVERDİ
Yüksek Lisans
İngilizce
2023
Astronomi ve Uzay BilimleriOrta Doğu Teknik Üniversitesiİstatistik Ana Bilim Dalı
PROF. DR. ÖZLEM İLK DAĞ