Sınıflandırma probleminde makine öğrenmesi algoritmalarının performansını artırmak için hibrit bir yöntem önerisi
A hybrid method proposal to improve performance of machine learning algorithms in classification problem
- Tez No: 821060
- Danışmanlar: PROF. DR. İPEK DEVECİ KOCAKOÇ
- Tez Türü: Doktora
- Konular: Ekonometri, Econometrics
- Anahtar Kelimeler: Makine öğrenmesi, Topluluk Öğrenmesi, Yığın, Sınıflandırma, Öznitelik Seçimi, Machine Learning, Ensemble Learning, Stacking, Classification, Feture Selection
- Yıl: 2023
- Dil: Türkçe
- Üniversite: Dokuz Eylül Üniversitesi
- Enstitü: Sosyal Bilimler Enstitüsü
- Ana Bilim Dalı: Ekonometri Ana Bilim Dalı
- Bilim Dalı: Ekonometri Bilim Dalı
- Sayfa Sayısı: 157
Özet
Makine öğrenmesi, sistemin geçmişteki deneyimlerinden elde edilen öğrenmelerini kullanarak bir model oluşturmasına ve gelecekte karşılaşacağı durumlar karşısında bir tahminde bulunmasını sağlayan bir yapay zekâ alanıdır. Sınıflandırma, regresyon ve kümeleme problemlerinin çözümünün gerçekleştirilmesi için çok sayıda makine öğrenme algoritması geliştirilmiştir. Yapılan çalışmada sınıflandırma problemi ele alınmıştır. Tezin amacı, sınıflandırma probleminin çözümünde kullanılan makine öğrenmesi algoritmalarının performansını artırmaktır. Algoritmaların performansı etkileyen en önemli unsur elimizdeki veri setindeki özniteliklerin yeterli sayıda ve gerekli olmasıdır. Bunun için sınıflandırma işlemini gerçekleştirmeden önce öznitelik seçimi yapılmaktadır. Öznitelik seçimi olarak da filtreleme ve sarmal yöntemleri birleştiren hibrit bir yaklaşım kullanılmıştır. Bu hibrit yaklaşımla, sadece filtreleme yönteminin kullanıldığı duruma nazaran sınıflandırma doğruluğunu iyileştirmekle kalmıyor, aynı zamanda sadece sarmal yöntemler kullanıldığı durumdaki işlem süresi de azaltılabilmektedir. Öznitelik seçimi sonrası genel olarak algoritmaların performansı iyileşmiştir. Algoritmanın performansını geliştirmek için diğer bir denenmiş yaklaşım ise, yığın (stacking) algoritmasında temel ve meta model olarak farklı algoritmalar denenerek daha iyi performansa sahip model bileşimi bulunmaya çalışılmıştır. Temel ve meta model olarak en iyi performansı verebilecek algoritmalara ilişkin genel geçer bir kabul bulunmamaktadır. Çalışmada farklı temel ve meta modeller kullanılarak 15504 model denenmiştir. Literatürde bu kadar kapsamlı bir model denemesi bulunmamaktadır yani bu konuda önemli eksiklik bulunmaktadır. Tüm algoritmalar içerisinden en iyi performansa sahip algoritmanın ardışık öznitelik seçimi sonrası yığın algoritması olduğu görülmüştür.
Özet (Çeviri)
Machine learning is a field of artificial intelligence that allows the system to create a model using its learning from past experiences and make a prediction about the situations it will encounter in the future. Many machine learning algorithms have been developed to solve classification, regression and clustering problems. In the study, the classification problem is discussed. The aim of the thesis is to improve the performance of machine learning algorithms used in solving the classification problem. The most important factor affecting the performance of algorithms is that the features in the data set we have are sufficient and relevant. For this, feature selection was made before performing the classification process. A hybrid approach combining filtering and wrapper methods is used for feature selection. With this hybrid approach, not only can the classification accuracy be improved when using filtering, but also the processing time can be reduced when only wrapper methods are used. Generally, the performance of algorithms has improved after feature Selection. Another tried to approach to improve the performance of the algorithm is to try to find a combination of models with better performance by trying different algorithms as basic and meta models in the stacking algorithm. The performance of the algorithm varies according to the base and meta-models used in the stacking algorithm. There is no general acceptance of algorithms that can give the best performance as a base and meta-model. In the study, 15504 models were tested using different base and meta models. No such exhaustive model experiment exists in the literature, so there is a significant deficiency in this respect. Among all algorithms, the algorithm with the best performance was found to be the stacking algorithm after sequential feature selection.
Benzer Tezler
- Prediction of COVID 19 disease using chest X-ray images based on deep learning
Derin öğrenmeye dayalı göğüs röntgen görüntüleri kullanarak COVID 19 hastalığının tahmini
ISMAEL ABDULLAH MOHAMMED AL-RAWE
Yüksek Lisans
İngilizce
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. ADEM TEKEREK
- Dengesiz veri setlerinde sınıflandırma performansını etkileyen yaklaşımların incelenmesi
Examination of approaches affecting classification performance in imbalanced data sets
SALİHA DEMİRSÖZ
Yüksek Lisans
Türkçe
2024
BiyoistatistikSelçuk ÜniversitesiBiyoistatistik Ana Bilim Dalı
DR. ÖĞR. ÜYESİ HARUN YONAR
- Classification of abnormal respiratory sounds using deep learning techniques
Solunum seslerinin derin öğrenme yöntemleri ile sınıflandırılması
AHAMADI ABDALLAH IDRISSE
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi ÜniversitesiBilgisayar Bilimleri Ana Bilim Dalı
DOÇ. DR. OKTAY YILDIZ
- Deep convolutional neural network based unconstrained ear recognition
Derin evrişimsel sinir ağı tabanlı kısıtsız kulak tanıma
FEVZİYE İREM EYİOKUR
Yüksek Lisans
İngilizce
2018
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. HAZIM KEMAL EKENEL
- A hybrid deep learning metaheuristic model for diagnosis of diabetic retinopathy
Diyabetik retinopatinin tanısı için hibrit bir derin öğrenme meta-sezgisel modeli
ÖMER FARUK GÜRCAN
Doktora
İngilizce
2022
Endüstri ve Endüstri Mühendisliğiİstanbul Teknik ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ÖMER FARUK BEYCA