Geri Dön

Rastgele orman yaklaşımı kullanılarak çok değişkenli uyumlu regresyon şeritlerinde model seçimi

Model selection in multivariate adaptive regression splines using random forest approach

  1. Tez No: 580234
  2. Yazar: DİLEK SABANCI
  3. Danışmanlar: PROF. DR. MEHMET ALİ CENGİZ
  4. Tez Türü: Doktora
  5. Konular: İstatistik, Statistics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2019
  8. Dil: Türkçe
  9. Üniversite: Ondokuz Mayıs Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: İstatistik Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 77

Özet

Çok değişkenli uyumlu regresyon şeritleri (MARS) makine öğreniminde bir denetimli öğrenme modeli olup, topluluk öğrenimi yöntemi ile elde edilmemektedir. Topluluk öğrenimi yöntemleri makine öğrenimi algoritmalarının istikrarını ve doğruluğunu iyileştirmek için ortak bir amaca hizmet eden yüzlerce ya da binlerce öğrenicinin oluşturduğu örneklemlerden bir araya getirilmektedir. Bu tezde MARS modeli, Rastgele Orman (RF) yönteminin algoritması kullanılarak topluluk öğrenimi yöntemi haline getirilmiştir. Torbalama (Bagging) yöntemi ile oluşturulan 200 adet eğitim ve test verisi Salford Predictive Modeler 8.3 programının MARS analiz motorunda analiz edilmiştir. Analiz sonucunda biri test verisine göre en küçük hata kareler ortalaması (Test MSE) değerini, diğeri en küçük genelleştirilmiş çapraz doğrulama (GCV) değerini veren iki farklı MARS modeller topluluğu oluşturulmuştur. Her bir modelin hata ölçüt kriterleri ve değişken önemleri ortalaması ile düğüm değerlerinin frekans sayıları incelenerek, en iyi modelin tahmini hem Test MSE hem GCV kriterleri için yapılmıştır. Sonuç olarak MARS modeli, en az orijinal veri setinden elde edilen MARS modeli kadar iyi sonuçlar veren yeni bir topluluk öğrenimi yöntemi ile elde edilmiştir. Büyük veri setlerinde daha iyi çalışan MARS modeli, önerilen yöntem sayesinde küçük veri setleri ile de güvenilir sonuçlar vermektedir.

Özet (Çeviri)

Multivariate Adaptive Regression Splines (MARS) is a supervised learning model in machine learning, not obtained by an ensemble learning method. Ensemble learning methods are gathered from samples comprising of hundreds or thousands of learners that serve a common purpose of improving the stability and accuracy of machine learning algorithms. In this thesis, the MARS model was transformed into an ensemble learning method using the algorithm of the Random Forest (RF) method. 200 training and test sets generated via the bagging method were analyzed in the MARS analysis engine of the Salford Predictive Modeler 8.3 software. At the end of the analysis, two different MARS model sets were created, one yielding the smallest Mean Square Error for the test data (Test MSE), and the other yielding the smallest Generalized Cross Validation (GCV) value. The estimation of the best model was conducted for both the Test MSE and the GCV criteria by examining the error of measurement criteria, variable importance averages and frequencies of the node values for each model. Eventually, a MARS model was obtained via a new ensemble learning method that yields results as good as the MARS model obtained from the original data set. The MARS model, which works better in larger data sets, provides more reliable results with smaller data sets by means of the proposed method.

Benzer Tezler

  1. Fake news classification using machine learning and deep learning approaches

    Makine öğrenimi ve derin öğrenme yaklaşımlarını kullanarak sahte haber sınıflandırması

    SAJA ABDULHALEEM MAHMOOD AL-OBAIDI

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ TUBA ÇAĞLIKANTAR

  2. Assessment of urbanization history of Addis Ababa city, Ethiopia

    Addıs Ababa cıty, Ethıopıa'nın kentleşme tarihinin değerlendirilmesi

    ABDURAHMAN HUSSEN YIMER

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Şehircilik ve Bölge PlanlamaMersin Üniversitesi

    Şehir ve Bölge Planlama Ana Bilim Dalı

    DOÇ. DR. ALİ CENAP YOLOĞLU

  3. Optimization of deep neural network architectures for the forest fire detection

    Orman yangini tespitinde derin sinir aği mimarilerinin optimizasyonu

    BERRİN SAVDA

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    PROF. DR. MÜŞTAK ERHAN YALÇIN

    PROF. DR. HAZIM KEMAL EKENEL

  4. Pre-release forecasting of imdb movie ratings using multi-view data

    Gösterime girmemiş filmlerin ımdb puanının farklı özellik kümeleri kullanılarak tahmin edilmesi

    BEYZA ÇİZMECİ

    Yüksek Lisans

    İngilizce

    İngilizce

    2018

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. ŞULE ÖĞÜDÜCÜ

  5. Coğrafi bilgi sistemleri entegreli makine öğrenmesine dayalı toplu taşınmaz değerleme modelinin geliştirilmesi

    Development of mass property valuation model based on geographic information systems integrated machine learning methods

    MUHAMMED OĞUZHAN METE

    Doktora

    Türkçe

    Türkçe

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Geomatik Mühendisliği Ana Bilim Dalı

    PROF. DR. TAHSİN YOMRALIOĞLU