A novel approach based on bagging and boosting for imbalanced classification problems
Dengesiz sınıflandırma sorunlarına torbalama ve arttırma esaslı yeni bir yaklaşım
- Tez No: 756020
- Danışmanlar: PROF. DR. İBRAHİM AKGÜN
- Tez Türü: Yüksek Lisans
- Konular: Endüstri ve Endüstri Mühendisliği, Industrial and Industrial Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2022
- Dil: İngilizce
- Üniversite: Abdullah Gül Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Endüstri Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 55
Özet
Sınıflandırma algoritmaları, engel tespiti, dolandırıcılık tespiti, tıbbi teşhis, istenmeyen posta tespiti, konuşma tanıma, görüntü işleme, izinsiz giriş tespiti ve benzeri gibi çok çeşitli gerçek dünya problemlerinde kullanılır. Ancak, meşru bir sınıflandırıcı önermek her zaman kolay bir iş değildir. Bir sınıflandırma görevi için, çok sayıda veri kümesi sınırlaması vardır. Gerçek dünyadaki sınıflandırma görevlerinde en çok karşılaşılan sınırlamalardan biri, sınıf dengesizliği sorunu olarak da adlandırılan çarpık sınıf dağılımıdır. Öğrenme, sınıf dengesiz veri kümelerinde mevcut algoritmalara uygun ayarlamalar yapılmadan kullanıldığında, azınlık sınıfları çoğunlukla yanlış sınıflandırılır. Bu çalışma, sınıf dengesizliği problemi için kullanılan kıyaslama veri kümeleri üzerinde önceki çalışmalardan daha iyi performans gösteren özgün bir sınıflandırma algoritması sunmaktadır. Sunulan yeni algoritma, yani BagBoost, azınlık sınıfı örneklerinin görünürlüğünü artırmak için değiştirilmiş torbalama ve değiştirilmiş artırma algoritmalarının bir araya getirilmesini içerir. Dengesiz veri kümelerinin sınıflandırılmasında en gelişmiş algoritmalar araştırılmıştır. Mevcut en iyi algoritmaların sonuçları, kıyaslama veri kümeleri kullanılarak önerilen algoritma ile karşılaştırılmıştır. Sonuçlar, BagBoost'un F-ölçü ve G-ortalama puanlarına göre kıyaslama veri setleri için literatürde yaygın olarak kullanılan sınıflandırma algoritmalarından daha iyi bir sınıflandırıcı olduğunu göstermektedir.
Özet (Çeviri)
Classification algorithms are employed in a wide range of real-world problems such as obstacle detection, fraud detection, medical diagnosis, spam detection, speech recognition, image processing, intrusion detection, and so forth. However, it is not always an easy task to propose a legitimate classifier. For a classification task, there are numerous limitations of datasets. One of the most confronted limitations in real-world classification tasks is skewed class distribution, also called the class imbalance problem. When learning is employed in class imbalanced datasets without incorporating appropriate adjustments into the existing algorithms, minority classes are mostly misclassified. This study introduces a novel classification algorithm that outperforms previous studies on benchmark datasets used for the class imbalance problem. The presented novel algorithm, namely, BagBoost, involves aggregating modified bagging and modified boosting algorithms to increase the visibility of minority class instances. The state-of-the-art algorithms in the classification of imbalanced datasets are investigated. The results of the best existing algorithms are compared with the proposed algorithm using benchmark datasets. Results show that BagBoost is a better classifier than commonly used classification algorithms in the literature for benchmark datasets according to F-measure and G-mean scores.
Benzer Tezler
- Gerçek rasgele sayı üreteçlerinin performansını iyileştirmek için yer değiştirme kutularını temel alan yeni bir yaklaşım
A novel approach based on substitution boxes to improve performance of true random number generators
ALİ MURAT GARİPCAN
Doktora
Türkçe
2021
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolFırat ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. EBUBEKİR ERDEM
- GPS'in engellendiği ortamlarda insansız hava aracı navigasyonu ve çarpışma önleme sistemleri için çoklu sensör veri birleştirmeye dayalı yeni bir yaklaşım
A novel approach based on multi-sensor data fusion for unmmanned aerial vehicle navigation and collision avoidance systems in GPS-denied environments
ELİF ECE ELMAS
Doktora
Türkçe
2024
Elektrik ve Elektronik MühendisliğiGazi ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
PROF. DR. MUSTAFA ALKAN
- A strategy based on statistical modelling and multi-objective optimization to design a dishwasher cleaning cycle
Bulaşık makinesi temizleme döngüsü tasarlamak için istatistiksel modellemeye ve çok amaçlı optimizasyona dayalı bir strateji
KORKUT ANAPA
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik ÜniversitesiBilimsel Hesaplama Ana Bilim Dalı
DOÇ. DR. HAMDULLAH YÜCEL
DR. SONGÜL BAYRAKTAR
- Yeni bir yaklaşımla yük profillerinin oluşturulması ve dağıtım sistemlerinde teknik kayıpların tahmini
A novel approach for load profile formation and technical loss estimation of electrical disrtibution systems
GİZEM TULUN
Yüksek Lisans
Türkçe
2016
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiElektrik Mühendisliği Ana Bilim Dalı
PROF. DR. ÖMER USTA
- Enerji sistemlerinde rüzgar hızı modellemesi için geliştirilen Finsler geometrisi tabanlı yeni bir yaklaşım analizi ve uygulaması
Analysis and application of a novel approach based on Finsler geometry for wind speed modelling in energy systems
EMRAH DOKUR
Doktora
Türkçe
2017
Elektrik ve Elektronik MühendisliğiBilecik Şeyh Edebali ÜniversitesiEnerji Sistemleri Mühendisliği Ana Bilim Dalı
PROF. DR. MEHMET KURBAN
YRD. DOÇ. DR. SALİM CEYHAN