Geri Dön

Bagging ve Boosting tabanlı sınıflandırma yöntemlerinde hiperparametre optimizasyonu

Hyperparameter optimization in Bagging and Boosting based classification methods

  1. Tez No: 906213
  2. Yazar: BUĞRA AKOĞLU
  3. Danışmanlar: PROF. DR. FİKRİ GÖKPINAR
  4. Tez Türü: Yüksek Lisans
  5. Konular: İstatistik, Statistics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2024
  8. Dil: Türkçe
  9. Üniversite: Gazi Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: İstatistik Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 107

Özet

Makine öğrenmesi, istatistiksel yöntemler kullanarak verilerden anlamlı desenler çıkararak, bilgisayarların deneyim yoluyla kendini geliştirebildiği bir yapay zeka dalıdır. Makine öğrenimi, günümüzde birçok alanda önemli sonuçlar elde etmiş ve teknolojik ilerlemenin temel unsurlarından biri haline gelmiştir. Bu kapsamda, bagging ve boosting gibi topluluk algoritmaları, büyük veri kümelerinde model performansını artırmak için yaygın olarak kullanılmaktadır. Bu durum, mevcut hiper parametrelerin sayısının artmasına yol açmıştır. Hiper parametreler, modelin davranışını belirleyen kritik unsurları şekillendirir ve bu parametrelerin uygun bir biçimde ayarlanması, tahmin performansı ile hesaplama verimliliğini doğrudan etkiler. Bu tez çalışmasında, bagging ve boosting topluluk öğrenme algoritmalarında çeşitli makine öğrenme yöntemlerinin adaptasyonu ve bu modellerin hiper parametre optimizasyonu incelenmiştir. Bu amaçla, UCI Machine Learning Repository'den alınan kuru üzüm veri seti, sınıflandırma problemi için kullanılmıştır. Veri seti, bilgisayarlı görü sistemleri (CVS) ile elde edilen ve Türkiye'den Keçimen ve Besni kuru üzüm çeşitlerine ait metrik verileri içermektedir. Modelleme aşamasında, Python programlama dili kullanılarak bagging entegrasyonu ile Lojistik Regresyon, Destek Vektör Makineleri ve Karar Ağaçları (bagging kullanımıyla Rastgele Orman) modelleri; boosting için ise Adaboost, Xgboost ve Catboost modelleri uygulanmıştır. Hiper parametre optimizasyonu, Optuna çerçevesi ve Bayes optimizasyonu kullanılarak gerçekleştirilmiş, çapraz doğrulama ve objektif performans ölçütleriyle değerlendirilmiştir. Sonuçlar, optimize edilen modellerin dengeli ve etkili olduğunu göstermiştir. Performans metrikleri olarak değerlendirilen doğruluk, kesinlik, F1 skoru ve duyarlılık oranları %85 ile %91 arasında değişiklik göstermiştir.

Özet (Çeviri)

Machine learning is a branch of artificial intelligence that enables computers to improve through experience by extracting meaningful patterns from data using statistical methods. Machine learning has achieved significant results in many fields today and has become one of the fundamental elements of technological advancement. In this context, ensemble algorithms such as bagging and boosting are widely used to enhance model performance in large datasets. This has led to an increase in the number of existing hyperparameters. Hyperparameters shape critical elements that determine the behavior of the model, and the proper tuning of these parameters directly impacts both prediction performance and computational efficiency. In this thesis, the adaptation of various machine learning methods in bagging and boosting ensemble learning algorithms and the hyperparameter optimization of these models were examined. For this purpose, the raisin dataset obtained from the UCI Machine Learning Repository was used for a classification problem. The dataset contains metric data of Keçimen and Besni raisin varieties from Türkiye, obtained through Computer Vision Systems (CVS). In the modeling phase, Logistic Regression, Support Vector Machines, and Decision Trees (Random Forest with bagging integration) were applied for bagging; and Adaboost, Xgboost, and Catboost models were applied for boosting. Hyperparameter optimization was performed using the Optuna framework and Bayesian optimization, evaluated through cross-validation and objective performance metrics. The results showed that the optimized models were balanced and effective. The performance metrics, evaluated as accuracy, precision, F1 score, and recall, ranged between 85% and 91%.

Benzer Tezler

  1. Topluluk öğrenme yöntemlerine dayalı bilgisayar destekli tanı sisteminin geliştirilmesi: genomik teknolojileri üzerine uygulaması

    Development of computer-aided diagnosis system based on ensemble learning methods: Application on genomic technologies

    ZEYNEP KÜÇÜKAKÇALI

    Doktora

    İngilizce

    İngilizce

    2023

    Biyoistatistikİnönü Üniversitesi

    Biyoistatistik ve Tıp Bilişimi Ana Bilim Dalı

    DOÇ. HARİKA GÖZDE GÖZÜKARA BAĞ

  2. Purchase prediction and item prediction with RNN using different user-item interactions

    Farklı kullanıcı-ürün etkileşim türlerini kullanarak özyineli sinir ağları ile ürün ve satış tahminlemesi

    FULYA ÇELEBİ SARIOĞLU

    Yüksek Lisans

    İngilizce

    İngilizce

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ YUSUF YASLAN

  3. Çok değişkenli kontrol diyagramında kontrol dışı duruma sebep olan değişkenlerin topluluk makine öğrenme algoritmaları ile tahmini

    Prediction of variables that the cause of out of control condition on multivariate control chart by ensemble machine learning algorithm

    DENİZ DEMİRCİOĞLU DİREN

    Doktora

    Türkçe

    Türkçe

    2020

    Endüstri ve Endüstri MühendisliğiSakarya Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    PROF. DR. SEMRA BORAN

  4. Classifier fusion for multimodal correlated classifiers and video annotation

    Bağımlı sınıflandırıcılar ve video işaretleme için sınıflandırıcı birleştirme

    ÜMİT EKMEKCİ

    Yüksek Lisans

    İngilizce

    İngilizce

    2014

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ZEHRA ÇATALTEPE

  5. Dizel makinanın makina öğrenmesi yöntemi kullanılarak modellenmesi ve karar-destek mekanizması oluşturulması

    Machine learning method based marine diesel engine modelling and decision-support system setting

    TOLGA ŞAHİN

    Doktora

    Türkçe

    Türkçe

    2022

    Makine Mühendisliğiİstanbul Teknik Üniversitesi

    Makine Mühendisliği Ana Bilim Dalı

    PROF. DR. CEVAT ERDEM İMRAK