Geri Dön

Özellik seçim yöntemleri kullanılarak sınıflandırma algoritmalarının performanslarının karşılaştırılması

Comparison of the performances of classification algorithms using feature selection methods

  1. Tez No: 677910
  2. Yazar: MUSTAFA DEMİR
  3. Danışmanlar: PROF. DR. İBRAHİM KILIÇ
  4. Tez Türü: Yüksek Lisans
  5. Konular: İstatistik, Statistics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2021
  8. Dil: Türkçe
  9. Üniversite: Afyon Kocatepe Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: İstatistik Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 72

Özet

Bu çalışmanın amacı, istatistik biliminde büyük önem teşkil eden sınıflandırma yöntemleri için ilgili veri setindeki değişkenlerin farklı özellik seçim yöntemleri ile belirlenmesidir. Özellik seçim yöntemleri k adet değişken seti içerisinden veri yapısına en uygun daha az sayıda değişkenin belirlenmesinde kullanılan ve sağladığı avantajlar bakımından da son yıllarda popülerliği artan istatistiksel yöntemler bütünüdür. Özellik seçim yöntemleri içerisinde kullanılan farklı teknikler, farklı sayıda ve farklı değişkenlerin seçilmesine sebep olabilmektedir. Bu çalışmada ilk olarak farklı tekniklere yardımıyla yapılan özellik seçimi sonucunda elde edilen yeni veri setleri oluşturulmuştur. Daha sonra oluşturulan bu veri setleri farklı makine öğrenme teknikleri ile analiz edilerek ilgili veri seti için yapılan karşılaştırmalar sonucunda en iyi makine öğrenme tekniği belirlenmiştir. Çalışmada kronik böbrek hastalığı veri seti kullanılarak Weka paket programı yardımı ile ilgili analizler gerçekleştirilmiştir. Analiz sonuçlarına göre korelasyon tabanlı özellik seçim yöntemi uygulandığında en iyi doğru sınıflandırma oranı %99.75 ile rassal orman ve çok katmanlı algılayıcı, filtre özellik seçim yöntemi uygulandığında %99.75 ile k-en yakın komşu, tutarlılık özellik seçim yöntemi uygulandığında %98.75 ile rassal orman en yüksek doğru sınıflandırma oranına sahiptir. Tutarlılık özellik seçim yöntemi uygulandığında %89 ile destek vektör makineleri(RTF Kernel ) en düşük doğru sınıflandırma oranını vermiştir. Bu çalışmadan elde edilen bulgular incelendiğinde aynı veri seti kullanılarak yapılan daha önceki çalışmalara nazaran daha yüksek doğru sınıflama oranları elde edilmiştir. Çalışmadan elde edilen diğer bulgu ve sonuçlar ilgili çizelge ve şekillerde sunulmuştur.

Özet (Çeviri)

The purpose of this study is to determine the variables in the relevant data set with different feature selection methods for classification methods, which are of great importance in statistics. Feature selection methods are a set of statistical methods, which are used to determine less number of variables that are most suitable for the data structure among k variable sets and have become popular in recent years in terms of their advantages. Different techniques used in feature selection methods may cause the selection of different numbers and different variables. In this study, firstly, new data sets obtained as a result of feature selection made with the help of different techniques were created. Afterwards, these data sets created were analyzed with different machine learning techniques and the best machine learning technique was determined as a result of the comparisons made for the relevant data set. In this study by using the cronic kidney data set, analyzes were carried out with the help of Weka software. According to the results of the analysis, the best correct classification rate is random forest and multilayer perceptron with 99.75% when the correlation-based feature selection method is applied, the k-nearest neighbor with 99.75% when the filter feature selection method is applied, and the random forest with 98.75% when the consistency feature selection method is applied. It has the correct classification rate. When the consistency feature selection method was applied, support vector machines (RBF Kernel) gave the lowest correct classification rate with 89%. The results of this study indicate that compared with the earlier studies using the same data set, the accuracy ratios of this study are much greater than the others. The other results obtained from this study are given in related tables and figures.

Benzer Tezler

  1. Boruta ve Elastik Ağ Algoritmalarının Gen Seçim Performanslarının RNA Dizileme Veri Setleri Üzerinde Karşılaştırılması: Bir Monte Carlo Benzetim Çalışması

    Comparison of Gene Selection Performances of Boruta and Elastic Net Algorithms on RNA Sequencing Data: A Monte Carlo Simulation Study

    ÖZGÜR SAMAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    BiyoistatistikHacettepe Üniversitesi

    Biyoistatistik Ana Bilim Dalı

    DOÇ. DR. OSMAN DAĞ

  2. Servikal kanserlerin teşhisinde kullanılan makine öğrenmesi algoritmalarının karşılaştırmalı analizi

    Comparative analysis of machine learning algorithms used in the diagnosis of cervical cancers

    TOLGA ÖZLEN

    Yüksek Lisans

    Türkçe

    Türkçe

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Aydın Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. ALİ GÜNEŞ

  3. Biyomedikal işaretlerin sınıflandırılması için akıllı tekniklerin Labview ortamında gerçeklenmesi

    Realization of intelligent techniques for classification of biomedical signals in the Labview

    DUYGU KAYA

    Doktora

    Türkçe

    Türkçe

    2018

    Elektrik ve Elektronik MühendisliğiFırat Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    DOÇ. DR. MUSTAFA TÜRK

  4. Moodle sistemindeki veriler ile makine öğrenmesi algoritmaları kullanılarak öğrencilerin dönem sonu akademik performanslarının tahmin edilmesi

    Predicting students academic performance at the end of the semester by using machine learning algorithms with the data in moodle system

    BUKET DÖNMEZ

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolİSTANBUL BEYKENT ÜNİVERSİTESİ

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ EGE KİPMAN

  5. Diyabet tespitinde makine öğrenmesi algoritmaları yaklaşımını kullanarak yapılmış bir çalışma

    A study using the approach of machine learning algorithm in detection of diabetes

    AYŞE DOĞRU

    Yüksek Lisans

    Türkçe

    Türkçe

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolÇankırı Karatekin Üniversitesi

    Elektrik ve Elektronik Mühendisliği Ana Bilim Dalı

    PROF. DR. MURAT ARI

    DR. ÖĞR. ÜYESİ SELİM BUYRUKOĞLU