Geri Dön

A novel approach based on bagging and boosting for imbalanced classification problems

Dengesiz sınıflandırma sorunlarına torbalama ve arttırma esaslı yeni bir yaklaşım

  1. Tez No: 756020
  2. Yazar: MUHAMMED ŞAFAK PİNAR
  3. Danışmanlar: PROF. DR. İBRAHİM AKGÜN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Endüstri ve Endüstri Mühendisliği, Industrial and Industrial Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2022
  8. Dil: İngilizce
  9. Üniversite: Abdullah Gül Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Endüstri Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 55

Özet

Sınıflandırma algoritmaları, engel tespiti, dolandırıcılık tespiti, tıbbi teşhis, istenmeyen posta tespiti, konuşma tanıma, görüntü işleme, izinsiz giriş tespiti ve benzeri gibi çok çeşitli gerçek dünya problemlerinde kullanılır. Ancak, meşru bir sınıflandırıcı önermek her zaman kolay bir iş değildir. Bir sınıflandırma görevi için, çok sayıda veri kümesi sınırlaması vardır. Gerçek dünyadaki sınıflandırma görevlerinde en çok karşılaşılan sınırlamalardan biri, sınıf dengesizliği sorunu olarak da adlandırılan çarpık sınıf dağılımıdır. Öğrenme, sınıf dengesiz veri kümelerinde mevcut algoritmalara uygun ayarlamalar yapılmadan kullanıldığında, azınlık sınıfları çoğunlukla yanlış sınıflandırılır. Bu çalışma, sınıf dengesizliği problemi için kullanılan kıyaslama veri kümeleri üzerinde önceki çalışmalardan daha iyi performans gösteren özgün bir sınıflandırma algoritması sunmaktadır. Sunulan yeni algoritma, yani BagBoost, azınlık sınıfı örneklerinin görünürlüğünü artırmak için değiştirilmiş torbalama ve değiştirilmiş artırma algoritmalarının bir araya getirilmesini içerir. Dengesiz veri kümelerinin sınıflandırılmasında en gelişmiş algoritmalar araştırılmıştır. Mevcut en iyi algoritmaların sonuçları, kıyaslama veri kümeleri kullanılarak önerilen algoritma ile karşılaştırılmıştır. Sonuçlar, BagBoost'un F-ölçü ve G-ortalama puanlarına göre kıyaslama veri setleri için literatürde yaygın olarak kullanılan sınıflandırma algoritmalarından daha iyi bir sınıflandırıcı olduğunu göstermektedir.

Özet (Çeviri)

Classification algorithms are employed in a wide range of real-world problems such as obstacle detection, fraud detection, medical diagnosis, spam detection, speech recognition, image processing, intrusion detection, and so forth. However, it is not always an easy task to propose a legitimate classifier. For a classification task, there are numerous limitations of datasets. One of the most confronted limitations in real-world classification tasks is skewed class distribution, also called the class imbalance problem. When learning is employed in class imbalanced datasets without incorporating appropriate adjustments into the existing algorithms, minority classes are mostly misclassified. This study introduces a novel classification algorithm that outperforms previous studies on benchmark datasets used for the class imbalance problem. The presented novel algorithm, namely, BagBoost, involves aggregating modified bagging and modified boosting algorithms to increase the visibility of minority class instances. The state-of-the-art algorithms in the classification of imbalanced datasets are investigated. The results of the best existing algorithms are compared with the proposed algorithm using benchmark datasets. Results show that BagBoost is a better classifier than commonly used classification algorithms in the literature for benchmark datasets according to F-measure and G-mean scores.

Benzer Tezler

  1. Gerçek rasgele sayı üreteçlerinin performansını iyileştirmek için yer değiştirme kutularını temel alan yeni bir yaklaşım

    A novel approach based on substitution boxes to improve performance of true random number generators

    ALİ MURAT GARİPCAN

    Doktora

    Türkçe

    Türkçe

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolFırat Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. EBUBEKİR ERDEM

  2. GPS'in engellendiği ortamlarda insansız hava aracı navigasyonu ve çarpışma önleme sistemleri için çoklu sensör veri birleştirmeye dayalı yeni bir yaklaşım

    A novel approach based on multi-sensor data fusion for unmmanned aerial vehicle navigation and collision avoidance systems in GPS-denied environments

    ELİF ECE ELMAS

    Doktora

    Türkçe

    Türkçe

    2024

    Elektrik ve Elektronik MühendisliğiGazi Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    PROF. DR. MUSTAFA ALKAN

  3. A strategy based on statistical modelling and multi-objective optimization to design a dishwasher cleaning cycle

    Bulaşık makinesi temizleme döngüsü tasarlamak için istatistiksel modellemeye ve çok amaçlı optimizasyona dayalı bir strateji

    KORKUT ANAPA

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik Üniversitesi

    Bilimsel Hesaplama Ana Bilim Dalı

    DOÇ. DR. HAMDULLAH YÜCEL

    DR. SONGÜL BAYRAKTAR

  4. Yeni bir yaklaşımla yük profillerinin oluşturulması ve dağıtım sistemlerinde teknik kayıpların tahmini

    A novel approach for load profile formation and technical loss estimation of electrical disrtibution systems

    GİZEM TULUN

    Yüksek Lisans

    Türkçe

    Türkçe

    2016

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    Elektrik Mühendisliği Ana Bilim Dalı

    PROF. DR. ÖMER USTA

  5. Enerji sistemlerinde rüzgar hızı modellemesi için geliştirilen Finsler geometrisi tabanlı yeni bir yaklaşım analizi ve uygulaması

    Analysis and application of a novel approach based on Finsler geometry for wind speed modelling in energy systems

    EMRAH DOKUR

    Doktora

    Türkçe

    Türkçe

    2017

    Elektrik ve Elektronik MühendisliğiBilecik Şeyh Edebali Üniversitesi

    Enerji Sistemleri Mühendisliği Ana Bilim Dalı

    PROF. DR. MEHMET KURBAN

    YRD. DOÇ. DR. SALİM CEYHAN