Geri Dön

Gözetimsiz öznitelik seçim algoritmalarının karşılaştırılması ve entropiye dayalı yeni bir yöntemin önerilmesi

A comparison of unsupervised feature selection algorithms and a new entropy-based method proposal

  1. Tez No: 874868
  2. Yazar: SAMET DEMİREL
  3. Danışmanlar: DR. ÖĞR. ÜYESİ FATİH AYDIN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2024
  8. Dil: Türkçe
  9. Üniversite: Balıkesir Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar ve Bilişim Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 72

Özet

Özellik seçim işlemi, Makine Öğrenimi algoritmalarının çok boyutluluğun lanetinden (curse of dimensionality) etkilenmemesi için çok önemlidir. Özellik seçim algoritmaları bu sorunu çözmeye çalışmaktadır. Ancak, özellik seçim algoritmalarının bazı yetersizlikleri vardır: (i) Her bir makine öğrenme algoritmasının performansı seçilen özellikler üzerinde önemli ölçüde farklı olabilir. (ii) Sınıflandırıcıların performansında, alt kümedeki varyasyona bağlı olarak önemli dalgalanmalar da gözlemlenebilir. (iii) Seçilen özellikler büyük veri kümeleri üzerinde uzun zaman harcayabilmektedir. Bu tezde, yukarıda bahsedilen sorunlarla başa çıkmak için, tek değişkenli ve filtre yaklaşımına dayanan, hızlı bir gözetimsiz özellik seçim algoritması önerilmektedir. Önerilen algoritma hem dağılımın kümülatif entropisini hem de dağılımın simetrisi ile hesaplanan Shannon entropisini her bir boyut için birlikte ele almaktadır. Son teknoloji algoritmalarla yapılan karşılaştırmalar sonucunda deneysel sonuçlar, önerilen yöntemin diğer yöntemlere kıyasla bu sorunlarla daha iyi başa çıkabildiğini göstermektedir.

Özet (Çeviri)

Feature selection task is essential for Machine Learning algorithms not to be influenced by the curse of dimensionality. In this regard, feature selection methods try to address this trouble. However, feature selection methods have some deficiencies: (i) the performance of each machine learning method can be remarkably different on the selected features (ii) significant changes can also be followed in the performance of the classifiers by depending on differences in the subset of selected feature (iii) they spend a long time on huge data sets. In this thesis, to cope with the aforementioned problems, we propose a fast unsupervised feature selection algorithm, which is based on a univariate and filter approach. The proposed method jointly regards both the cumulative entropy of the distribution and the Shannon entropy calculated by the symmetry of the distribution for each feature. As a result of comparisons with cutting-edge works, the experimental results demonstrate that the presented algorithm better overcomes these problems compared to other methods.

Benzer Tezler

  1. Ağ bağlantılı veriler için gözetimsiz ikili öznitelik oluşturma yöntemi

    Unsupervised binary feature construction method for networked data

    ARZU KAKIŞIM

    Doktora

    Türkçe

    Türkçe

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGebze Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. İBRAHİM SOĞUKPINAR

  2. Mixed integer programming and heuristics approaches for clustering with cluster-based feature selection

    Küme özgü öznitelik seçimi ile kümeleme problemi için karma tamsayılı programlama ve sezgisel yaklaşımlar

    SENA ÖNEN ÖZ

    Yüksek Lisans

    İngilizce

    İngilizce

    2019

    Endüstri ve Endüstri MühendisliğiOrta Doğu Teknik Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    DOÇ. DR. CEM İYİGÜN

  3. Aircraft detection from large scale remote sensing images with deep learning techniques

    Büyük ölçekli uzaktan algılama görüntülerinden derin öğrenme teknikleriyle uçak tespiti

    MEHMET SOYDAŞ

    Yüksek Lisans

    İngilizce

    İngilizce

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    İletişim Sistemleri Ana Bilim Dalı

    PROF. DR. ELİF SERTEL

  4. Predicting the preference of liking using fNIRS and machine learning algorithms

    fNIRS ve makine öğrenmesi algoritmaları ile beğeni tahmini

    MEHMET YİĞİT KÖKSAL

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolMEF ÜNİVERSİTESİ

    Bilişim Teknolojileri Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ TUNA ÇAKAR

  5. Feature subset generation for ensemble learning using feature clustering and mutual information

    Topluluk öğrenme için öznitelik kümeleme ve karşılıklı bilgi kullanarak öznitelik altkümesi oluşturma

    HANA AMAR

    Yüksek Lisans

    İngilizce

    İngilizce

    2016

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBahçeşehir Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    ASST. ASSOC. CEMAL OKAN ŞAKAR