Exploring the impact of feature selection techniques on machine learning performance
Özellik seçim tekniklerinin makine öğrenme performansı üzerindeki etkisinin araştırılması
- Tez No: 826903
- Danışmanlar: DR. ÖĞR. ÜYESİ AYÇA KURNAZ TÜRKBEN
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2023
- Dil: İngilizce
- Üniversite: Altınbaş Üniversitesi
- Enstitü: Lisansüstü Eğitim Enstitüsü
- Ana Bilim Dalı: Bilişim Teknolojileri Ana Bilim Dalı
- Bilim Dalı: Bilişim Teknolojileri Bilim Dalı
- Sayfa Sayısı: 76
Özet
Özel seçim, modelin genel iyileştirmeyi iyileştirecek en ilgili ve bilgilendirici özelliklerin tanımlanmasına yönelik özet hedef ile makine geliştirmesinde çok önemli bir aşamadır. Bu tez, çeşitli özellik seçme tekniklerinin makine geliştirmei performansının üzerindeki yansımalarını araştırıyor ve bunların farklı alanlarındaki kayıtlarını araştırıyor. İlk bölümler, makine yapılandırması modellerinin geliştirilmesindeki tanım ve önemi dahil olmak üzere, seçimin özetinin bir şekilde anlaşılmasını sağlar. Filtre, sarmalayıcı ve gömülü çözümler içeren farklı seçenek seçme yöntemleri anlatılmaktadır. Özel seçme tekniklerinin etkililiğini değerlendirmeye yönelik değerlendirme kriterleri de sunulmaktadır. Ki-Kare, Bilgi Kazanımı, Korelasyon Katsayısı ve Karşılıklı Bilgi gibi geleneksel özellik seçim teknikleri, Güçlü özellikler ve sınırlamalar dikkate alınarak özetlenir. Tez, bu tekniklerin çeşitli alanlardaki makine geliştirmei performansını değerlendiriyor; Alanın kendine özgü performansı, boyutsallığı azaltmayı, performans uygulamalarını ve ilgili zorluklar ve destekleniyor. Denetimli, denetimsiz ve hibrit özellik seçme teknikleri araştırılarak bunların algoritmaları ve uygulanabilirlikleri hakkında sağlanan bilgiler. Ek olarak tez, derin öğrenme süreçlerini detay seçimini araştırıyor ve bunun benzersiz hususlarını ve ortaya çıktığını vurguluyor. Yüksek boyutlu veriler, özellik iletişimi ve artıklık ile ilgili konular da dahil olmak üzere özellik özelliklerindeki zorluklar ve detaylar ele alınmaktadır. Tez, özellik seçiminin başarıyla başladığı uygulama alanları araştırılıyor ve çeşitli alanlardaki çalışmalar gösteriliyor. Tez, özellik seçeneklerinin özellikleri ve araştırma öğeleri ile daha fazla araştırma ve geliştirme aralıklarının vurgulanmasıyla sonuçlandırılmaktadır. Genel olarak bu tez, özellik seçme tekniklerinin ve bunların makine öğrenme performansının üzerindeki etkilerinin eklenmesi bulunmaktadır. Bu araştırmadan elde edilen bulgular ve içgörüler, bulgulara ve araştırmacılara özellikleri etkili bir şekilde seçmede yardımcı olabilir, böylece modelin varlığını sürdürebilir ve çeşitli alanlardaki mevcutların yaşayabileceği söylenebilir. Genel olarak bu tez, özellik seçme tekniklerinin ve bunların makine öğrenme performansının üzerindeki etkilerinin eklenmesi bulunmaktadır. Bu araştırmadan elde edilen bulgular ve içgörüler, bulgulara ve araştırmacılara özellikleri etkili bir şekilde seçmede yardımcı olabilir, böylece modelin varlığını sürdürebilir ve çeşitli alanlardaki mevcutların yaşayabileceği söylenebilir. Genel olarak bu tez, özellik seçme tekniklerinin ve bunların makine öğrenme performansının üzerindeki etkilerinin eklenmesi bulunmaktadır. Bu araştırmadan elde edilen bulgular ve içgörüler, bulgulara ve araştırmacılara özellikleri etkili bir şekilde seçmede yardımcı olabilir, böylece modelin varlığını sürdürebilir ve çeşitli alanlardaki mevcutların yaşayabileceği söylenebilir.
Özet (Çeviri)
Feature selection is a crucial stage in machine learning, with the overarching goal of identifying the most relevant and informative characteristics with which to improve the model's overall performance. This thesis explores repercussions of various feature selection techniques on machine learning performance and investigates their effectiveness across different domains. The initial sections provide a comprehensive understanding of feature selection, including its definition and significance in enhancing machine learning models. Different types of feature selection methods are discussed, encompassing filter, wrapper, and embedded approaches. Evaluation criteria for assessing the effectiveness of feature selection techniques are also presented. Traditional feature selection techniques, such as Chi-Square, Information Gain, Correlation Coefficient, and Mutual Information, are thoroughly examined, considering their strengths and limitations. The thesis evaluates the impact of these techniques on machine learning performance across various domains, emphasizing domain-specific performance, dimensionality reduction, performance improvement, and the associated challenges and considerations. Supervised, unsupervised, and hybrid feature selection techniques are explored, providing insights into their methodologies and applicability. Additionally, the thesis investigates feature selection in the context of deep learning, highlighting its unique considerations and implications. Challenges and considerations in feature selection are addressed, including issues related to high-dimensional data, feature interaction, and redundancy. The thesis surveys application domains where feature selection has been successfully applied, demonstrating its effectiveness across diverse fields. The thesis concludes with future directions and research gaps in feature selection, highlighting areas that require further investigation and development. Overall, this thesis contributes to the understanding of feature selection techniques and their impact on machine learning performance. The findings and insights gained from this research can aid practitioners and researchers in effectively selecting features, thereby improving model performance and addressing challenges across various domains.
Benzer Tezler
- Machine-learning approaches for neurological disorder diagnosis from genomic and neuroimaging data
Genomik ve nörogörüntüleme verilerinden nörolojik bozukluk teşhisi için makine öğrenmesi yaklaşımları
İSMAİL BİLGEN
Doktora
İngilizce
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. BEHÇET UĞUR TÖREYİN
- Predicting software defects with machine learning
Makine öğrenmeyle yazılım hatalarını öngörmek
MUAYAD MOHAMMED KHALEEL AL ISAWI
Yüksek Lisans
İngilizce
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAltınbaş ÜniversitesiBilişim Teknolojileri Ana Bilim Dalı
DR. ÖĞR. ÜYESİ OĞUZ KARAN
- Mil-Std 1553 tabanlı sistemler için yeni bir saldırı tespiti yaklaşımı
A new intrusion detection approach for Mil-Std 1553 based systems
YUNUS EMRE ÇİLOĞLU
Yüksek Lisans
Türkçe
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. ŞERİF BAHTİYAR
- A comparative study for football analytics with data mining and artificial intelligence techniques
Veri madenciliği ve yapay zeka teknikleri ile karşılaştırmalı futbol analitiği
MUSTAFA AADEL MASHJAL AL-ASADI
Doktora
İngilizce
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSelçuk ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. ŞAKİR TAŞDEMİR
- Building energy consumption modeling and prediction using data-driven models
Bina enerji tüketimi modelleme ve tahmini için veri odakli modeller
SODABA ROGH
Yüksek Lisans
İngilizce
2024
Elektrik ve Elektronik MühendisliğiOSTİM TEKNİK ÜNİVERSİTESİElektrik ve Elektronik Mühendisliği Ana Bilim Dalı
PROF. DR. İSMAİL AVCIBAŞ