Geri Dön

Makine öğrenmesi algoritmalarının performans analizi: Simülasyon ve orman yangını verisi üzerinde uygulama

Performance analysis of machine learning algorithms: A simulation-based study and an application on forest fire data

  1. Tez No: 967234
  2. Yazar: CEYDA MURAT
  3. Danışmanlar: DOÇ. DR. ESRA GÖKPINAR
  4. Tez Türü: Yüksek Lisans
  5. Konular: İstatistik, Statistics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2025
  8. Dil: Türkçe
  9. Üniversite: Gazi Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: İstatistik Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 86

Özet

Makine öğrenmesi, bilgisayarların verilerden öğrenmesini ve bu verilerle anlamlı tahminler, sınıflandırmalar yapmasını sağlayan bir yapay zekâ alanıdır. Bu alandaki algoritmalar, örüntü tanıma, veri analizi ve öngörüde bulunma gibi işlemleri gerçekleştirebilme yeteneği sayesinde pek çok farklı uygulama alanında kullanılmaktadır. Bu tez çalışmasında, Python programlama dili kullanılarak makine öğrenmesi algoritmalarının farklı veri dağılımları altında nasıl performans gösterdiğini incelemek ve orman yangınlarını önceden tahmin etmek ve hızlı müdahaleye olanak sağlamayı amaçlanmıştır. Bu doğrultuda, öncelikle simülasyon çalışmalarıyla çeşitli veri dağılımlarından üretilen yapay veri setlerinde sınıflandırma algoritmalarının performansları karşılaştırılmıştır. Sonuçlar, model performanslarının veri setinin dağılımsal özelliklerine ve sınıf dengesine göre değiştiğini ortaya koymaktadır. Lojistik Regresyon, Naive Bayes ve Destek Vektör Makineleri normal dağılımlarda yüksek performans sergilerken, normal olmayan dağılımlarda ağaç tabanlı yöntemler daha başarılı sonuçlar vermiştir. Ayrıca bir uygulama üzerinde de bu modellerin performanslarına bakılmıştır. Buna göre T.C. Tarım ve Orman Bakanlığı tarafından sağlanan, yangın tahminini etkileyen meteorolojik, topografik ve bitki örtüsü gibi değişkenleri içeren bir veri seti üzerinde kapsamlı ön işleme adımları gerçekleştirilmiştir. Hiper parametre optimizasyonu ile modeller eğitilmiş ve performansları değerlendirilmiştir. Veri seti üzerinde hem genel bir model eğitimi hem de bölge bazında model eğitimleri gerçekleştirilmiştir. Türkiye geneli model performans sonuçlarına göre, Rastgele Orman, XGBoost ve Gradient Boosting algoritmaları en yüksek performansı göstermiştir. Bölgesel analizlerde ise en başarılı modellerin bölgelere göre değiştiği gözlemlenmiştir.

Özet (Çeviri)

Machine learning is a field of artificial intelligence that enables computers to learn from data and make meaningful predictions and classifications with this data. Algorithms in this field are used in many different application areas thanks to their ability to perform operations such as pattern recognition, data analysis and prediction. In this thesis, it is aimed to examine how machine learning algorithms perform under different data distributions using Python programming language and to predict forest fires and enable rapid intervention. In this direction, firstly, the performances of classification algorithms on artificial data sets generated from various data distributions were compared through simulation studies. The results show that model performances vary according to the distributional characteristics of the data set and class balance. While Logistic Regression, Naive Bayes and Support Vector Machines showed high performance in normal distributions, tree-based methods gave better results in non-normal distributions.The performances of these models were also analysed on an application. Accordingly, extensive pre-processing steps were performed on a data set provided by the Ministry of Agriculture and Forestry, which includes variables such as meteorological, topographic and vegetation cover affecting fire prediction. The models were trained with hyper parameter optimisation and their performances were evaluated. Both a general model training and region-based model training were performed on the data set. According to Turkey-wide model performance results, Random Forest, XGBoost and Gradient Boosting algorithms showed the highest performance. In regional analyses, it has been observed that the most successful models vary from region to region.

Benzer Tezler

  1. Sağdan sansürlü sağkalım analizinde makine öğrenmesinde sınıflandırma algoritmaların kullanımı

    Using of classification algorithms in machine learning for right censored survival analysis

    PELİN AKIN

    Doktora

    Türkçe

    Türkçe

    2020

    İstatistikOndokuz Mayıs Üniversitesi

    İstatistik Ana Bilim Dalı

    PROF. DR. YÜKSEL TERZİ

  2. Kronik hepatit C hastalığı risk belirlenmesinde sıralı lojistik regresyon ve makine öğrenme algoritmalarının sınıflama performansının karşılaştırılması

    Comparison of classification performance of ordinal logistic regression and machine learning algorithms for risk determination of chronic hepatitis C disease

    ALİ VASFİ AĞLARCI

    Doktora

    Türkçe

    Türkçe

    2022

    BiyoistatistikEskişehir Osmangazi Üniversitesi

    Biyoistatistik Ana Bilim Dalı

    DOÇ. DR. CENGİZ BAL

  3. İklimlendirme sistemleri üzerinde makine öğrenmesi ile anomali tespiti

    Anomaly detection with machine learning on air conditioning systems

    REFİK KİBAR

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSakarya Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ MUHAMMED FATİH ADAK

    DR. ÖĞR. ÜYESİ KEVSER OVAZ AKPINAR

  4. Açık uçlu eşeksenel prob ile dielektrik spektroskopi için makine öğrenmesi temelli kestirim yöntemleri

    Machine learning based estimation methods for dielectric spectroscopy with open-ended coaxial probe

    MUSA ALPEREN YILMAZ

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    PROF. DR. MEHMET ÇAYÖREN

  5. Irregular longitudinal data analysis with statistical and machine learning methods in asteroid dataset

    Asteroid veri kümesinde istatistiksel ve makine öğrenme yöntemleriyle düzensiz boylamsal veri analizi

    İREM TANRIVERDİ

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Astronomi ve Uzay BilimleriOrta Doğu Teknik Üniversitesi

    İstatistik Ana Bilim Dalı

    PROF. DR. ÖZLEM İLK DAĞ