Kararlı ve başarımı yüksek öznitelik seçimi
Stable and accurate feature selection
- Tez No: 251774
- Danışmanlar: DOÇ. DR. ZEHRA ÇATALTEPE
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2009
- Dil: Türkçe
- Üniversite: İstanbul Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 85
Özet
Bu çalışmada, öncelikle MRMR (Minimum Redundancy Maximum Relevance) ve FCBF (Fast Correlation-Based Filter) öznitelik seçme algoritmaları tanıtılarak başarım yönünden karşılaştırılmaları yapılmıştır. Ardından iki öznitelik kümesi arasındaki kararlılık değerini ölçen yeni bir kararlılık ölçütü ortaya konulmuştur. MRMR algoritmasının kullandığı iki seçim kriteri olan MID (Mutual Information Difference) ve MIQ (Mutual Information Quotinent) yöntemleri hem başarım hem de kararlılık yönünden karşılaştırılmıştır. Bu iki metodun başarım yönünden yakın sonuçlar verdiği görülmüştür. Diğer taraftan özellikle küçük veri kümeleri için MID yöntemi MIQ yöntemine göre daha kararlı öznitelik kümeleri ile sonuçlanmıştır. MID yönteminin neden daha kararlı bir öznitelik seçim kriteri olduğu teorik olarak ortaya konulmaya çalışılmış ve bu sav deneysel olarak desteklenmiştir. Ayrıca eğitim veri kümelerinin örnek sayısını azaltarak öznitelik seçme algoritmalarının kararlılığını ve başarımını ölçen bir deneysel metodoloji modeli sunulmuştur. MRMR algoritması için, özniteliklerin sınıf etiketleri ile ilişkisinin ve öznitelik artıklığının öznitelik seçimindeki etkisini bir parametre yardımıyla kontrol eden yeni bir seçim kriteri, ortaya konularak değişik parametre değerleri için farklı veri kümelerinde yeni seçim kriterinin kararlılık ve başarım değerleri gözlenmiştir. Yeni seçim kriteri ile öznitelik seçiminde kararlılığın kontrol edilebileceği deneysel olarak gösterilmiştir.
Özet (Çeviri)
In this study, firstly MRMR (Minimum Redundancy Maximum Relevance) and FCBF (Fast Correlation-Based Filter) feature selection algorithms are presented and compared to each other according to accuracy. Afterwards a new stability measure that can measure the stability between two sets of features is introduced. The two feature evaluation methods within MRMR, MID (Mutual Information Difference) and MIQ (Mutual Information Quotinent) are compared both in stability and accuracy. These two methods result in features with similar accuracy. On the other hand, especially for small data sets, MID results in more stable feature sets than MIQ. Theoretical explanation for why MID is a better cirteria for small sample size is given and it is supported with experimental test results. A new experimental model is also introduced in order to measure the accuracy and the stability of a feature selection algoritm for the case of a reduction of training samples. A new feature selection criterion where redundancy and relevance of selected features are controlled by parameter is presented and using the predefined model, its accuracy and stability values are obtained for different parameter values for various datasets. It is empirically shown that stability of feature selection can be controlled using new criterion.
Benzer Tezler
- Fukunaga-Koontz dönüşümü tabanlı algoritmaların geliştirilmesi ve hedef tespiti-sınıflandırma uygulamaları
Development of Fukunaga-Koontz transform based algorithms and target detection-classification applications
HAMİDULLAH BİNOL
Doktora
Türkçe
2016
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolYıldız Teknik ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
PROF. DR. HERMAN SEDEF
- Fake news classification using machine learning and deep learning approaches
Makine öğrenimi ve derin öğrenme yaklaşımlarını kullanarak sahte haber sınıflandırması
SAJA ABDULHALEEM MAHMOOD AL-OBAIDI
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ TUBA ÇAĞLIKANTAR
- Early prognosis of breast cancer using image processing and machine learning
Görüntü işleme ve makine öğrenmesi yöntemiyle erken meme kanseri teşhisi
SENA BÜŞRA YENGEÇ TAŞDEMİR
Yüksek Lisans
İngilizce
2018
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAbdullah Gül ÜniversitesiElektrik ve Bilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ZAFER AYDIN
- Dictionary ensemble based active learning for multiple instance image classification
Çoklu örnekli görüntü sınıflandırması için sözlük topluluğu tabanlı aktif öğrenme
GÖKHAN KOÇYİĞİT
Yüksek Lisans
İngilizce
2016
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. YUSUF YASLAN
- New methods for robust speech recognition
Konuşma tanıma için gürültüye dayanıklı yeni yöntemler
ENGİN ERZİN
Yüksek Lisans
İngilizce
1995
Elektrik ve Elektronik Mühendisliğiİhsan Doğramacı Bilkent ÜniversitesiDOÇ.DR. A. ENİS ÇETİN