Python kullanarak makine öğreniminde özellik seçimi
Feature selection in machine learning using python
- Tez No: 953332
- Danışmanlar: PROF. DR. AYLA ŞAYLI
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Matematik, Computer Engineering and Computer Science and Control, Mathematics
- Anahtar Kelimeler: Özellik seçim algoritmaları, makine öğrenmesi, sınıflandırma algoritmaları, Feature selection algorithms, machine learning, classification algorithms
- Yıl: 2025
- Dil: Türkçe
- Üniversite: Yıldız Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Matematik Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Matematik Mühendisliği Bilim Dalı
- Sayfa Sayısı: 140
Özet
Günümüzde teknolojinin gelişmesiyle dijital verilerin önemi artmaktadır. Bu verilerdeki gizli bilgileri ortaya çıkarmak için makine öğreniminden yararlanılmaktadır. Fakat kirli, eksik ve fazla özellik içeren verilerin son yıllarda hızlı bir şekilde artmasıyla birlikte makine öğrenmesi modellerinin performans kalitesi olumsuz yönde etkilenebilir. Bu sebeple model kurulmadan önce veri ön işleme aşamalarından geçirilmelidir ve özellik seçimi veri setini en iyi tanımlayan özelliklerin seçilmesi için kullanılan en önemli ön işleme adımlarından biridir. Bu özelliklerin seçilmesi ile veri boyutu düşürülerek hızlı ve yüksek performanslı bir model elde edilebilir. Önemli özellikleri belirlemek ilerde yapılacak çalışmalarda veri toplama sürecinde ve veri görselleştirmede kolaylık sağlayacaktır. Ayrıca veri ön işleme, eğitim ve tahmin aşamalarında daha az zaman harcanacaktır. Bu çalışma farklı alanlardan 5 veri seti üstünde gerçekleştirilmiştir. Veri setlerine filtreleme, sarmal ve gömülü özellik seçim yöntemlerinden olan özellik alt kümesini otomatik kendisi veren ve özellik sayısını kullanıcının belirlediği özellik alt kümesini otomatik şekilde vermeyen 16 farklı özellik seçim algoritması uygulanmıştır. Otomatik olmayan özellik seçim algoritmalarında özellik sayısını ayarlamak için otomatik özellik seçim algoritmalarını kullanarak ortalamaya dayalı filtreleme ve minimuma dayalı filtreleme olmak üzere 2 yaklaşım önerilmiştir. Özellik seçimlerinden sonra elde edilen setler üzerinde 8 farklı sınıflandırma algoritması kullanılarak doğruluk, duyarlılık, kesinlik, F1-Skoru performansları ve sınıflandırma süreleri ölçülmüştür ve karşılaştırılmıştır.
Özet (Çeviri)
Today, with the development of technology, the importance of digital data is increasing. Machine learning is utilized to reveal hidden information in these data. However, with the rapid increase in data containing dirty, incomplete, and excessive features in recent years, the performance quality of machine learning models can be negatively affected. For this reason, the data should be subjected to preprocessing steps before model building, and feature selection is one of the most important preprocessing steps used to select the features that best describe the dataset. By selecting these features, the data size can be reduced and a fast and high-performance model can be obtained. Determining important features will facilitate the data collection process and data visualisation in future studies. Also, less time will be spent in the data pre-processing, training and prediction steps. This study was carried out on 5 data sets from different fields. 16 different feature selection algorithms were applied to the datasets, including filtering, wrapper and embedded feature selection methods that automatically give the feature subset and do not automatically give the feature subset where the number of features is determined by the user. Two approaches were proposed to adjust the number of features in non-automatic feature selection algorithms using automatic feature selection algorithms: mean-based filtering and minimum-based filtering. After feature selection, 8 different classification algorithms were used on the obtained sets and their accuracy, sensitivity, precision, F1-Score performances and classification times were measured and compared.
Benzer Tezler
- Deep feature transfer from deep learning models into machine learning algorithms to classify COVID-19 from chest X-ray images
Göğüs röntgeni görüntülerinden COVID-19 sınıflandırması yapmak amacıyla derin öğrenme modellerinden makine öğrenmesi algoritmalarına derin öznitelik aktarımı
OZAN GÜLDALİ
Yüksek Lisans
İngilizce
2021
Matematikİstanbul Teknik ÜniversitesiMatematik Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ GÜL İNAN
- Taşınabilir yürütülebilir dosyalarda yinelenen sinir ağlarını kullanarak statik kötü amaçlı yazılım algılama
Static malware detection using recurrent neural networks in portable executables
MUSA GÜL
Yüksek Lisans
Türkçe
2021
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolMersin ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. ERDİNÇ AVAROĞLU
- Sürekli üretim hatlarında denetimli yapay zekâ yöntemlerinin kalite tespitinde kullanımı
Use of supervised artificial intelligence methods in quality determination in continuous production lines
SERDAR ÖZCAN
Doktora
Türkçe
2024
İşletmeÇanakkale Onsekiz Mart Üniversitesiİşletme Ana Bilim Dalı
DOÇ. DR. ÜMRAN ŞENGÜL
- Python pyaudio modülü kullanarak konuşma dilinden işaret diline makine öğrenmesi tabanlı tercüme sistemi
Machine learning-based speech to sign language interpretation system using python pyaudio module
AATIF OSMAN ALTAHIR BAKR
Yüksek Lisans
Türkçe
2022
Elektrik ve Elektronik Mühendisliğiİstanbul Üniversitesi-CerrahpaşaElektrik ve Elektronik Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ RANA ORTAÇ KABAOĞLU
- Prediction of corona-virus infection by using deep learning and machine learning
Derin öğrenme ve makine öğrenmeyle korona-virüs enfeksiyonunun tahmini
LAITH IBRAHIM SALIH AL-ALI
Yüksek Lisans
İngilizce
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Okan ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. PINAR YILDIRIM