Gözetimsiz öznitelik seçim algoritmalarının karşılaştırılması ve entropiye dayalı yeni bir yöntemin önerilmesi
A comparison of unsupervised feature selection algorithms and a new entropy-based method proposal
- Tez No: 874868
- Danışmanlar: DR. ÖĞR. ÜYESİ FATİH AYDIN
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2024
- Dil: Türkçe
- Üniversite: Balıkesir Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar ve Bilişim Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 72
Özet
Özellik seçim işlemi, Makine Öğrenimi algoritmalarının çok boyutluluğun lanetinden (curse of dimensionality) etkilenmemesi için çok önemlidir. Özellik seçim algoritmaları bu sorunu çözmeye çalışmaktadır. Ancak, özellik seçim algoritmalarının bazı yetersizlikleri vardır: (i) Her bir makine öğrenme algoritmasının performansı seçilen özellikler üzerinde önemli ölçüde farklı olabilir. (ii) Sınıflandırıcıların performansında, alt kümedeki varyasyona bağlı olarak önemli dalgalanmalar da gözlemlenebilir. (iii) Seçilen özellikler büyük veri kümeleri üzerinde uzun zaman harcayabilmektedir. Bu tezde, yukarıda bahsedilen sorunlarla başa çıkmak için, tek değişkenli ve filtre yaklaşımına dayanan, hızlı bir gözetimsiz özellik seçim algoritması önerilmektedir. Önerilen algoritma hem dağılımın kümülatif entropisini hem de dağılımın simetrisi ile hesaplanan Shannon entropisini her bir boyut için birlikte ele almaktadır. Son teknoloji algoritmalarla yapılan karşılaştırmalar sonucunda deneysel sonuçlar, önerilen yöntemin diğer yöntemlere kıyasla bu sorunlarla daha iyi başa çıkabildiğini göstermektedir.
Özet (Çeviri)
Feature selection task is essential for Machine Learning algorithms not to be influenced by the curse of dimensionality. In this regard, feature selection methods try to address this trouble. However, feature selection methods have some deficiencies: (i) the performance of each machine learning method can be remarkably different on the selected features (ii) significant changes can also be followed in the performance of the classifiers by depending on differences in the subset of selected feature (iii) they spend a long time on huge data sets. In this thesis, to cope with the aforementioned problems, we propose a fast unsupervised feature selection algorithm, which is based on a univariate and filter approach. The proposed method jointly regards both the cumulative entropy of the distribution and the Shannon entropy calculated by the symmetry of the distribution for each feature. As a result of comparisons with cutting-edge works, the experimental results demonstrate that the presented algorithm better overcomes these problems compared to other methods.
Benzer Tezler
- Ağ bağlantılı veriler için gözetimsiz ikili öznitelik oluşturma yöntemi
Unsupervised binary feature construction method for networked data
ARZU KAKIŞIM
Doktora
Türkçe
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGebze Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. İBRAHİM SOĞUKPINAR
- Mixed integer programming and heuristics approaches for clustering with cluster-based feature selection
Küme özgü öznitelik seçimi ile kümeleme problemi için karma tamsayılı programlama ve sezgisel yaklaşımlar
SENA ÖNEN ÖZ
Yüksek Lisans
İngilizce
2019
Endüstri ve Endüstri MühendisliğiOrta Doğu Teknik ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
DOÇ. DR. CEM İYİGÜN
- Aircraft detection from large scale remote sensing images with deep learning techniques
Büyük ölçekli uzaktan algılama görüntülerinden derin öğrenme teknikleriyle uçak tespiti
MEHMET SOYDAŞ
Yüksek Lisans
İngilizce
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesiİletişim Sistemleri Ana Bilim Dalı
PROF. DR. ELİF SERTEL
- Predicting the preference of liking using fNIRS and machine learning algorithms
fNIRS ve makine öğrenmesi algoritmaları ile beğeni tahmini
MEHMET YİĞİT KÖKSAL
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolMEF ÜNİVERSİTESİBilişim Teknolojileri Ana Bilim Dalı
DR. ÖĞR. ÜYESİ TUNA ÇAKAR
- Feature subset generation for ensemble learning using feature clustering and mutual information
Topluluk öğrenme için öznitelik kümeleme ve karşılıklı bilgi kullanarak öznitelik altkümesi oluşturma
HANA AMAR
Yüksek Lisans
İngilizce
2016
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBahçeşehir ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
ASST. ASSOC. CEMAL OKAN ŞAKAR