Geri Dön

Exploring the impact of feature selection techniques on machine learning performance

Özellik seçim tekniklerinin makine öğrenme performansı üzerindeki etkisinin araştırılması

  1. Tez No: 826903
  2. Yazar: OMAR ALI FARHAN AL-MAJMAEE
  3. Danışmanlar: DR. ÖĞR. ÜYESİ AYÇA KURNAZ TÜRKBEN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2023
  8. Dil: İngilizce
  9. Üniversite: Altınbaş Üniversitesi
  10. Enstitü: Lisansüstü Eğitim Enstitüsü
  11. Ana Bilim Dalı: Bilişim Teknolojileri Ana Bilim Dalı
  12. Bilim Dalı: Bilişim Teknolojileri Bilim Dalı
  13. Sayfa Sayısı: 76

Özet

Özel seçim, modelin genel iyileştirmeyi iyileştirecek en ilgili ve bilgilendirici özelliklerin tanımlanmasına yönelik özet hedef ile makine geliştirmesinde çok önemli bir aşamadır. Bu tez, çeşitli özellik seçme tekniklerinin makine geliştirmei performansının üzerindeki yansımalarını araştırıyor ve bunların farklı alanlarındaki kayıtlarını araştırıyor. İlk bölümler, makine yapılandırması modellerinin geliştirilmesindeki tanım ve önemi dahil olmak üzere, seçimin özetinin bir şekilde anlaşılmasını sağlar. Filtre, sarmalayıcı ve gömülü çözümler içeren farklı seçenek seçme yöntemleri anlatılmaktadır. Özel seçme tekniklerinin etkililiğini değerlendirmeye yönelik değerlendirme kriterleri de sunulmaktadır. Ki-Kare, Bilgi Kazanımı, Korelasyon Katsayısı ve Karşılıklı Bilgi gibi geleneksel özellik seçim teknikleri, Güçlü özellikler ve sınırlamalar dikkate alınarak özetlenir. Tez, bu tekniklerin çeşitli alanlardaki makine geliştirmei performansını değerlendiriyor; Alanın kendine özgü performansı, boyutsallığı azaltmayı, performans uygulamalarını ve ilgili zorluklar ve destekleniyor. Denetimli, denetimsiz ve hibrit özellik seçme teknikleri araştırılarak bunların algoritmaları ve uygulanabilirlikleri hakkında sağlanan bilgiler. Ek olarak tez, derin öğrenme süreçlerini detay seçimini araştırıyor ve bunun benzersiz hususlarını ve ortaya çıktığını vurguluyor. Yüksek boyutlu veriler, özellik iletişimi ve artıklık ile ilgili konular da dahil olmak üzere özellik özelliklerindeki zorluklar ve detaylar ele alınmaktadır. Tez, özellik seçiminin başarıyla başladığı uygulama alanları araştırılıyor ve çeşitli alanlardaki çalışmalar gösteriliyor. Tez, özellik seçeneklerinin özellikleri ve araştırma öğeleri ile daha fazla araştırma ve geliştirme aralıklarının vurgulanmasıyla sonuçlandırılmaktadır. Genel olarak bu tez, özellik seçme tekniklerinin ve bunların makine öğrenme performansının üzerindeki etkilerinin eklenmesi bulunmaktadır. Bu araştırmadan elde edilen bulgular ve içgörüler, bulgulara ve araştırmacılara özellikleri etkili bir şekilde seçmede yardımcı olabilir, böylece modelin varlığını sürdürebilir ve çeşitli alanlardaki mevcutların yaşayabileceği söylenebilir. Genel olarak bu tez, özellik seçme tekniklerinin ve bunların makine öğrenme performansının üzerindeki etkilerinin eklenmesi bulunmaktadır. Bu araştırmadan elde edilen bulgular ve içgörüler, bulgulara ve araştırmacılara özellikleri etkili bir şekilde seçmede yardımcı olabilir, böylece modelin varlığını sürdürebilir ve çeşitli alanlardaki mevcutların yaşayabileceği söylenebilir. Genel olarak bu tez, özellik seçme tekniklerinin ve bunların makine öğrenme performansının üzerindeki etkilerinin eklenmesi bulunmaktadır. Bu araştırmadan elde edilen bulgular ve içgörüler, bulgulara ve araştırmacılara özellikleri etkili bir şekilde seçmede yardımcı olabilir, böylece modelin varlığını sürdürebilir ve çeşitli alanlardaki mevcutların yaşayabileceği söylenebilir.

Özet (Çeviri)

Feature selection is a crucial stage in machine learning, with the overarching goal of identifying the most relevant and informative characteristics with which to improve the model's overall performance. This thesis explores repercussions of various feature selection techniques on machine learning performance and investigates their effectiveness across different domains. The initial sections provide a comprehensive understanding of feature selection, including its definition and significance in enhancing machine learning models. Different types of feature selection methods are discussed, encompassing filter, wrapper, and embedded approaches. Evaluation criteria for assessing the effectiveness of feature selection techniques are also presented. Traditional feature selection techniques, such as Chi-Square, Information Gain, Correlation Coefficient, and Mutual Information, are thoroughly examined, considering their strengths and limitations. The thesis evaluates the impact of these techniques on machine learning performance across various domains, emphasizing domain-specific performance, dimensionality reduction, performance improvement, and the associated challenges and considerations. Supervised, unsupervised, and hybrid feature selection techniques are explored, providing insights into their methodologies and applicability. Additionally, the thesis investigates feature selection in the context of deep learning, highlighting its unique considerations and implications. Challenges and considerations in feature selection are addressed, including issues related to high-dimensional data, feature interaction, and redundancy. The thesis surveys application domains where feature selection has been successfully applied, demonstrating its effectiveness across diverse fields. The thesis concludes with future directions and research gaps in feature selection, highlighting areas that require further investigation and development. Overall, this thesis contributes to the understanding of feature selection techniques and their impact on machine learning performance. The findings and insights gained from this research can aid practitioners and researchers in effectively selecting features, thereby improving model performance and addressing challenges across various domains.

Benzer Tezler

  1. Machine-learning approaches for neurological disorder diagnosis from genomic and neuroimaging data

    Genomik ve nörogörüntüleme verilerinden nörolojik bozukluk teşhisi için makine öğrenmesi yaklaşımları

    İSMAİL BİLGEN

    Doktora

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. BEHÇET UĞUR TÖREYİN

  2. Predicting software defects with machine learning

    Makine öğrenmeyle yazılım hatalarını öngörmek

    MUAYAD MOHAMMED KHALEEL AL ISAWI

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAltınbaş Üniversitesi

    Bilişim Teknolojileri Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ OĞUZ KARAN

  3. Mil-Std 1553 tabanlı sistemler için yeni bir saldırı tespiti yaklaşımı

    A new intrusion detection approach for Mil-Std 1553 based systems

    YUNUS EMRE ÇİLOĞLU

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ŞERİF BAHTİYAR

  4. A comparative study for football analytics with data mining and artificial intelligence techniques

    Veri madenciliği ve yapay zeka teknikleri ile karşılaştırmalı futbol analitiği

    MUSTAFA AADEL MASHJAL AL-ASADI

    Doktora

    İngilizce

    İngilizce

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSelçuk Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. ŞAKİR TAŞDEMİR

  5. Building energy consumption modeling and prediction using data-driven models

    Bina enerji tüketimi modelleme ve tahmini için veri odakli modeller

    SODABA ROGH

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Elektrik ve Elektronik MühendisliğiOSTİM TEKNİK ÜNİVERSİTESİ

    Elektrik ve Elektronik Mühendisliği Ana Bilim Dalı

    PROF. DR. İSMAİL AVCIBAŞ