Geri Dön

Kararlı ve başarımı yüksek öznitelik seçimi

Stable and accurate feature selection

  1. Tez No: 251774
  2. Yazar: GÖKHAN GÜLGEZEN
  3. Danışmanlar: DOÇ. DR. ZEHRA ÇATALTEPE
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2009
  8. Dil: Türkçe
  9. Üniversite: İstanbul Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 85

Özet

Bu çalışmada, öncelikle MRMR (Minimum Redundancy Maximum Relevance) ve FCBF (Fast Correlation-Based Filter) öznitelik seçme algoritmaları tanıtılarak başarım yönünden karşılaştırılmaları yapılmıştır. Ardından iki öznitelik kümesi arasındaki kararlılık değerini ölçen yeni bir kararlılık ölçütü ortaya konulmuştur. MRMR algoritmasının kullandığı iki seçim kriteri olan MID (Mutual Information Difference) ve MIQ (Mutual Information Quotinent) yöntemleri hem başarım hem de kararlılık yönünden karşılaştırılmıştır. Bu iki metodun başarım yönünden yakın sonuçlar verdiği görülmüştür. Diğer taraftan özellikle küçük veri kümeleri için MID yöntemi MIQ yöntemine göre daha kararlı öznitelik kümeleri ile sonuçlanmıştır. MID yönteminin neden daha kararlı bir öznitelik seçim kriteri olduğu teorik olarak ortaya konulmaya çalışılmış ve bu sav deneysel olarak desteklenmiştir. Ayrıca eğitim veri kümelerinin örnek sayısını azaltarak öznitelik seçme algoritmalarının kararlılığını ve başarımını ölçen bir deneysel metodoloji modeli sunulmuştur. MRMR algoritması için, özniteliklerin sınıf etiketleri ile ilişkisinin ve öznitelik artıklığının öznitelik seçimindeki etkisini bir parametre yardımıyla kontrol eden yeni bir seçim kriteri, ortaya konularak değişik parametre değerleri için farklı veri kümelerinde yeni seçim kriterinin kararlılık ve başarım değerleri gözlenmiştir. Yeni seçim kriteri ile öznitelik seçiminde kararlılığın kontrol edilebileceği deneysel olarak gösterilmiştir.

Özet (Çeviri)

In this study, firstly MRMR (Minimum Redundancy Maximum Relevance) and FCBF (Fast Correlation-Based Filter) feature selection algorithms are presented and compared to each other according to accuracy. Afterwards a new stability measure that can measure the stability between two sets of features is introduced. The two feature evaluation methods within MRMR, MID (Mutual Information Difference) and MIQ (Mutual Information Quotinent) are compared both in stability and accuracy. These two methods result in features with similar accuracy. On the other hand, especially for small data sets, MID results in more stable feature sets than MIQ. Theoretical explanation for why MID is a better cirteria for small sample size is given and it is supported with experimental test results. A new experimental model is also introduced in order to measure the accuracy and the stability of a feature selection algoritm for the case of a reduction of training samples. A new feature selection criterion where redundancy and relevance of selected features are controlled by parameter is presented and using the predefined model, its accuracy and stability values are obtained for different parameter values for various datasets. It is empirically shown that stability of feature selection can be controlled using new criterion.

Benzer Tezler

  1. Fukunaga-Koontz dönüşümü tabanlı algoritmaların geliştirilmesi ve hedef tespiti-sınıflandırma uygulamaları

    Development of Fukunaga-Koontz transform based algorithms and target detection-classification applications

    HAMİDULLAH BİNOL

    Doktora

    Türkçe

    Türkçe

    2016

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolYıldız Teknik Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    PROF. DR. HERMAN SEDEF

  2. Fake news classification using machine learning and deep learning approaches

    Makine öğrenimi ve derin öğrenme yaklaşımlarını kullanarak sahte haber sınıflandırması

    SAJA ABDULHALEEM MAHMOOD AL-OBAIDI

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ TUBA ÇAĞLIKANTAR

  3. Early prognosis of breast cancer using image processing and machine learning

    Görüntü işleme ve makine öğrenmesi yöntemiyle erken meme kanseri teşhisi

    SENA BÜŞRA YENGEÇ TAŞDEMİR

    Yüksek Lisans

    İngilizce

    İngilizce

    2018

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAbdullah Gül Üniversitesi

    Elektrik ve Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ZAFER AYDIN

  4. Dictionary ensemble based active learning for multiple instance image classification

    Çoklu örnekli görüntü sınıflandırması için sözlük topluluğu tabanlı aktif öğrenme

    GÖKHAN KOÇYİĞİT

    Yüksek Lisans

    İngilizce

    İngilizce

    2016

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. YUSUF YASLAN

  5. New methods for robust speech recognition

    Konuşma tanıma için gürültüye dayanıklı yeni yöntemler

    ENGİN ERZİN

    Yüksek Lisans

    İngilizce

    İngilizce

    1995

    Elektrik ve Elektronik Mühendisliğiİhsan Doğramacı Bilkent Üniversitesi

    DOÇ.DR. A. ENİS ÇETİN