Geri Dön

Sınıflandırma probleminde makine öğrenmesi algoritmalarının performansını artırmak için hibrit bir yöntem önerisi

A hybrid method proposal to improve performance of machine learning algorithms in classification problem

  1. Tez No: 821060
  2. Yazar: MERYEM PULAT
  3. Danışmanlar: PROF. DR. İPEK DEVECİ KOCAKOÇ
  4. Tez Türü: Doktora
  5. Konular: Ekonometri, Econometrics
  6. Anahtar Kelimeler: Makine öğrenmesi, Topluluk Öğrenmesi, Yığın, Sınıflandırma, Öznitelik Seçimi, Machine Learning, Ensemble Learning, Stacking, Classification, Feture Selection
  7. Yıl: 2023
  8. Dil: Türkçe
  9. Üniversite: Dokuz Eylül Üniversitesi
  10. Enstitü: Sosyal Bilimler Enstitüsü
  11. Ana Bilim Dalı: Ekonometri Ana Bilim Dalı
  12. Bilim Dalı: Ekonometri Bilim Dalı
  13. Sayfa Sayısı: 157

Özet

Makine öğrenmesi, sistemin geçmişteki deneyimlerinden elde edilen öğrenmelerini kullanarak bir model oluşturmasına ve gelecekte karşılaşacağı durumlar karşısında bir tahminde bulunmasını sağlayan bir yapay zekâ alanıdır. Sınıflandırma, regresyon ve kümeleme problemlerinin çözümünün gerçekleştirilmesi için çok sayıda makine öğrenme algoritması geliştirilmiştir. Yapılan çalışmada sınıflandırma problemi ele alınmıştır. Tezin amacı, sınıflandırma probleminin çözümünde kullanılan makine öğrenmesi algoritmalarının performansını artırmaktır. Algoritmaların performansı etkileyen en önemli unsur elimizdeki veri setindeki özniteliklerin yeterli sayıda ve gerekli olmasıdır. Bunun için sınıflandırma işlemini gerçekleştirmeden önce öznitelik seçimi yapılmaktadır. Öznitelik seçimi olarak da filtreleme ve sarmal yöntemleri birleştiren hibrit bir yaklaşım kullanılmıştır. Bu hibrit yaklaşımla, sadece filtreleme yönteminin kullanıldığı duruma nazaran sınıflandırma doğruluğunu iyileştirmekle kalmıyor, aynı zamanda sadece sarmal yöntemler kullanıldığı durumdaki işlem süresi de azaltılabilmektedir. Öznitelik seçimi sonrası genel olarak algoritmaların performansı iyileşmiştir. Algoritmanın performansını geliştirmek için diğer bir denenmiş yaklaşım ise, yığın (stacking) algoritmasında temel ve meta model olarak farklı algoritmalar denenerek daha iyi performansa sahip model bileşimi bulunmaya çalışılmıştır. Temel ve meta model olarak en iyi performansı verebilecek algoritmalara ilişkin genel geçer bir kabul bulunmamaktadır. Çalışmada farklı temel ve meta modeller kullanılarak 15504 model denenmiştir. Literatürde bu kadar kapsamlı bir model denemesi bulunmamaktadır yani bu konuda önemli eksiklik bulunmaktadır. Tüm algoritmalar içerisinden en iyi performansa sahip algoritmanın ardışık öznitelik seçimi sonrası yığın algoritması olduğu görülmüştür.

Özet (Çeviri)

Machine learning is a field of artificial intelligence that allows the system to create a model using its learning from past experiences and make a prediction about the situations it will encounter in the future. Many machine learning algorithms have been developed to solve classification, regression and clustering problems. In the study, the classification problem is discussed. The aim of the thesis is to improve the performance of machine learning algorithms used in solving the classification problem. The most important factor affecting the performance of algorithms is that the features in the data set we have are sufficient and relevant. For this, feature selection was made before performing the classification process. A hybrid approach combining filtering and wrapper methods is used for feature selection. With this hybrid approach, not only can the classification accuracy be improved when using filtering, but also the processing time can be reduced when only wrapper methods are used. Generally, the performance of algorithms has improved after feature Selection. Another tried to approach to improve the performance of the algorithm is to try to find a combination of models with better performance by trying different algorithms as basic and meta models in the stacking algorithm. The performance of the algorithm varies according to the base and meta-models used in the stacking algorithm. There is no general acceptance of algorithms that can give the best performance as a base and meta-model. In the study, 15504 models were tested using different base and meta models. No such exhaustive model experiment exists in the literature, so there is a significant deficiency in this respect. Among all algorithms, the algorithm with the best performance was found to be the stacking algorithm after sequential feature selection.

Benzer Tezler

  1. Prediction of COVID 19 disease using chest X-ray images based on deep learning

    Derin öğrenmeye dayalı göğüs röntgen görüntüleri kullanarak COVID 19 hastalığının tahmini

    ISMAEL ABDULLAH MOHAMMED AL-RAWE

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. ADEM TEKEREK

  2. Dengesiz veri setlerinde sınıflandırma performansını etkileyen yaklaşımların incelenmesi

    Examination of approaches affecting classification performance in imbalanced data sets

    SALİHA DEMİRSÖZ

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    BiyoistatistikSelçuk Üniversitesi

    Biyoistatistik Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ HARUN YONAR

  3. Classification of abnormal respiratory sounds using deep learning techniques

    Solunum seslerinin derin öğrenme yöntemleri ile sınıflandırılması

    AHAMADI ABDALLAH IDRISSE

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi Üniversitesi

    Bilgisayar Bilimleri Ana Bilim Dalı

    DOÇ. DR. OKTAY YILDIZ

  4. Deep convolutional neural network based unconstrained ear recognition

    Derin evrişimsel sinir ağı tabanlı kısıtsız kulak tanıma

    FEVZİYE İREM EYİOKUR

    Yüksek Lisans

    İngilizce

    İngilizce

    2018

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. HAZIM KEMAL EKENEL

  5. A hybrid deep learning metaheuristic model for diagnosis of diabetic retinopathy

    Diyabetik retinopatinin tanısı için hibrit bir derin öğrenme meta-sezgisel modeli

    ÖMER FARUK GÜRCAN

    Doktora

    İngilizce

    İngilizce

    2022

    Endüstri ve Endüstri Mühendisliğiİstanbul Teknik Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ÖMER FARUK BEYCA