Geri Dön

Adaboost-bagging sınıflandırıcısını iyileştirmeye yönelik hibrit bir örnekleme algoritması: Sağlık alanında bir uygulama

A hybrid sampling algorithm to improve the adaboost-bagging classificer: An application in health

  1. Tez No: 809673
  2. Yazar: BURCU DURMUŞ
  3. Danışmanlar: PROF. DR. ÖZNUR İŞÇİ GÜNERİ
  4. Tez Türü: Doktora
  5. Konular: İstatistik, Statistics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2023
  8. Dil: Türkçe
  9. Üniversite: Muğla Sıtkı Koçman Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: İstatistik Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 178

Özet

Sınıflandırma çalışmalarında sıklıkla dengesiz sınıf dağılımı probleminin varlığı göze çarpmaktadır. Dengesiz veri kümeleri ile çalışırken model kurma aşamasında çoğunluk sınıfı baskın gelmekte ve azınlık sınıfına ait gözlemler sınıflandırılırken sınıflandırıcıların performanslarında düşüş yaşanmakta ya da modeller yanlı olmaktadır. Literatürde bu problemi çözmek için önerilen pek çok yöntem vardır. En sık tercih edilen ise, yeniden örnekleme yöntemidir. Bu tez çalışmasında iki farklı noktaya odaklanılmıştır. Birincisi yeniden örnekleme yöntemleri ile sınıf dengesizliği probleminin giderilmesidir. İkinci ise, AdaBoost-Bagging sınıflandırıcısını iyileştirmeye yönelik önerilen Ada.Bag yöntemi ile sınıflandırma analizinin yapılmasıdır. Sınıf dengesizliği problemini çözmek amacıyla yeni bir yeniden örnekleme algoritması önerilmiştir. Önerilen yöntem, SMOTE yönteminin mesafe uzaklıklarına dayalı olarak geliştirilmiş bir versiyonudur. Bu yöntem, mesafe ölçülerini kullanarak SMOTE yönteminde yer alan rastgele komşu seçiminin önüne geçmekte ve üretilecek sentetik verilerin daha az gürültü üretmesini sağlamaktadır. Çalışmada önerilen ikinci yöntem ise, AdaBoost ve Bagging yöntemlerini Bayes sınıflandırıcısını temel alarak kombine eden ve Ada.Bag olarak adlandırılan hibrit bir sınıflandırma algoritmasıdır. Bu yöntem ile sınıflandırma analizinde çoklu model tekniği kullanılarak model performansı yüksek sonuçlar elde etmek amaçlanmıştır. Çalışmanın uygulama bölümünde on beş veri seti ele alınmıştır. Her bir veri setine SMOTE ve önerilen yöntem uygulanarak dengesizlik problemleri giderilmiştir. Uygulamanın ikinci bölümünde ise dengesizlik problemi giderilen veriler, Adaboost ve önerilen Ada.Bag yöntemi ile sınıflandırma analizine tabi tutulmuştur. Uygulanan yöntemlerin başarısını değerlendirmek amacıyla sonuçlar farklı performans kriterleri çerçevesinde karşılaştırılmıştır. Sonuç olarak, önerilen her iki yöntemin de mevcut yöntemlerden daha iyi olduğu gösterilmiştir.

Özet (Çeviri)

In classification studies, the existence of unbalanced class distribution problem is often observed. When working with unbalanced datasets, the majority class dominates the model building phase and the performance of the classifiers decreases while classifying the observations belonging to the minority class or the models are biased. There are many proposed methods in the literature to solve this problem. The most preferred method is resampling. This thesis has focused on two different points. The first is to eliminate the class imbalance problem with resampling methods. The second is to perform classification analysis with the Ada.Bag method proposed to improve the AdaBoost-Bagging classifier. A new resampling algorithm is proposed to solve the class imbalance problem. The proposed method is an improved version of the SMOTE method based on cartesian distances. This method avoids the random neighbor selection in the SMOTE method by using cartesian distances and ensures that the synthetic data to be produced produces less noise. The second method proposed in the study is a hybrid classification algorithm called Ada.Bag, which is created by combining AdaBoost and Bagging methods based on Bayesian classifier. With this method, it is aimed to obtain results with high model performance by using the multiple model technique in classification analysis. Fifteen data sets were discussed in the application part of the study. Unbalance problems were eliminated by applying SMOTE and the proposed method to each data set. In the second part of the application, the data whose imbalance problem is resolved were subjected to classification analysis with Adaboost and the proposed Ada.Bag method. In order to evaluate the success of the applied methods, the results were compared within the framework of different performance criteria. As a result, it has been shown that both proposed methods are better than existing methods.

Benzer Tezler

  1. Combining multiple machine learning algorithms to learn rules and exceptions

    Kurallar ve istisnaların öğrenilmesi için birden çok sınıflandırıcının birleştirilmesi

    CENK KAYNAK

    Doktora

    İngilizce

    İngilizce

    2002

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ETHEM ALPAYDIN

  2. Classifier fusion for multimodal correlated classifiers and video annotation

    Bağımlı sınıflandırıcılar ve video işaretleme için sınıflandırıcı birleştirme

    ÜMİT EKMEKCİ

    Yüksek Lisans

    İngilizce

    İngilizce

    2014

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ZEHRA ÇATALTEPE

  3. Yaygın sınıflandırıcıların Scikit-learn, Weka ve Matlabaraçları ile Twitter spam tespitinde karşılaştırılması

    Comparing common classifiers for twitter spam detection in Scikit-learn, Weka and Matlab

    ANIL DÜZGÜN

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ FECİR DURAN

    DR. ATİLLA ÖZGÜR

  4. Lisans yerleştirme sınavında yerleşme başarısının karar ağaçlarına göre bagging ve boosting yöntemleriyle sınıflandırılması

    Classification of replacement success according to decision trees by using bagging and boosting methods

    TUĞBA TUĞ KAROĞLU

    Doktora

    Türkçe

    Türkçe

    2018

    İstatistikVan Yüzüncü Yıl Üniversitesi

    Zootekni Ana Bilim Dalı

    PROF. DR. HAYRETTİN OKUT

  5. Fusion of pupil dilation and facial temperature features for detection of stress

    Gözbebeği açılımı ve yüze ait sıcaklık özniteliklerinin stres tespiti için birleştirilmesi

    SERDAR BALTACI

    Doktora

    İngilizce

    İngilizce

    2016

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik Üniversitesi

    Sağlık Bilişimi Ana Bilim Dalı

    YRD. DOÇ. DR. DİDEM GÖKÇAY