Geri Dön

Python kullanarak makine öğreniminde özellik seçimi

Feature selection in machine learning using python

  1. Tez No: 953332
  2. Yazar: EMEL UĞURLU
  3. Danışmanlar: PROF. DR. AYLA ŞAYLI
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Matematik, Computer Engineering and Computer Science and Control, Mathematics
  6. Anahtar Kelimeler: Özellik seçim algoritmaları, makine öğrenmesi, sınıflandırma algoritmaları, Feature selection algorithms, machine learning, classification algorithms
  7. Yıl: 2025
  8. Dil: Türkçe
  9. Üniversite: Yıldız Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Matematik Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Matematik Mühendisliği Bilim Dalı
  13. Sayfa Sayısı: 140

Özet

Günümüzde teknolojinin gelişmesiyle dijital verilerin önemi artmaktadır. Bu verilerdeki gizli bilgileri ortaya çıkarmak için makine öğreniminden yararlanılmaktadır. Fakat kirli, eksik ve fazla özellik içeren verilerin son yıllarda hızlı bir şekilde artmasıyla birlikte makine öğrenmesi modellerinin performans kalitesi olumsuz yönde etkilenebilir. Bu sebeple model kurulmadan önce veri ön işleme aşamalarından geçirilmelidir ve özellik seçimi veri setini en iyi tanımlayan özelliklerin seçilmesi için kullanılan en önemli ön işleme adımlarından biridir. Bu özelliklerin seçilmesi ile veri boyutu düşürülerek hızlı ve yüksek performanslı bir model elde edilebilir. Önemli özellikleri belirlemek ilerde yapılacak çalışmalarda veri toplama sürecinde ve veri görselleştirmede kolaylık sağlayacaktır. Ayrıca veri ön işleme, eğitim ve tahmin aşamalarında daha az zaman harcanacaktır. Bu çalışma farklı alanlardan 5 veri seti üstünde gerçekleştirilmiştir. Veri setlerine filtreleme, sarmal ve gömülü özellik seçim yöntemlerinden olan özellik alt kümesini otomatik kendisi veren ve özellik sayısını kullanıcının belirlediği özellik alt kümesini otomatik şekilde vermeyen 16 farklı özellik seçim algoritması uygulanmıştır. Otomatik olmayan özellik seçim algoritmalarında özellik sayısını ayarlamak için otomatik özellik seçim algoritmalarını kullanarak ortalamaya dayalı filtreleme ve minimuma dayalı filtreleme olmak üzere 2 yaklaşım önerilmiştir. Özellik seçimlerinden sonra elde edilen setler üzerinde 8 farklı sınıflandırma algoritması kullanılarak doğruluk, duyarlılık, kesinlik, F1-Skoru performansları ve sınıflandırma süreleri ölçülmüştür ve karşılaştırılmıştır.

Özet (Çeviri)

Today, with the development of technology, the importance of digital data is increasing. Machine learning is utilized to reveal hidden information in these data. However, with the rapid increase in data containing dirty, incomplete, and excessive features in recent years, the performance quality of machine learning models can be negatively affected. For this reason, the data should be subjected to preprocessing steps before model building, and feature selection is one of the most important preprocessing steps used to select the features that best describe the dataset. By selecting these features, the data size can be reduced and a fast and high-performance model can be obtained. Determining important features will facilitate the data collection process and data visualisation in future studies. Also, less time will be spent in the data pre-processing, training and prediction steps. This study was carried out on 5 data sets from different fields. 16 different feature selection algorithms were applied to the datasets, including filtering, wrapper and embedded feature selection methods that automatically give the feature subset and do not automatically give the feature subset where the number of features is determined by the user. Two approaches were proposed to adjust the number of features in non-automatic feature selection algorithms using automatic feature selection algorithms: mean-based filtering and minimum-based filtering. After feature selection, 8 different classification algorithms were used on the obtained sets and their accuracy, sensitivity, precision, F1-Score performances and classification times were measured and compared.

Benzer Tezler

  1. Deep feature transfer from deep learning models into machine learning algorithms to classify COVID-19 from chest X-ray images

    Göğüs röntgeni görüntülerinden COVID-19 sınıflandırması yapmak amacıyla derin öğrenme modellerinden makine öğrenmesi algoritmalarına derin öznitelik aktarımı

    OZAN GÜLDALİ

    Yüksek Lisans

    İngilizce

    İngilizce

    2021

    Matematikİstanbul Teknik Üniversitesi

    Matematik Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ GÜL İNAN

  2. Taşınabilir yürütülebilir dosyalarda yinelenen sinir ağlarını kullanarak statik kötü amaçlı yazılım algılama

    Static malware detection using recurrent neural networks in portable executables

    MUSA GÜL

    Yüksek Lisans

    Türkçe

    Türkçe

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolMersin Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ERDİNÇ AVAROĞLU

  3. Sürekli üretim hatlarında denetimli yapay zekâ yöntemlerinin kalite tespitinde kullanımı

    Use of supervised artificial intelligence methods in quality determination in continuous production lines

    SERDAR ÖZCAN

    Doktora

    Türkçe

    Türkçe

    2024

    İşletmeÇanakkale Onsekiz Mart Üniversitesi

    İşletme Ana Bilim Dalı

    DOÇ. DR. ÜMRAN ŞENGÜL

  4. Python pyaudio modülü kullanarak konuşma dilinden işaret diline makine öğrenmesi tabanlı tercüme sistemi

    Machine learning-based speech to sign language interpretation system using python pyaudio module

    AATIF OSMAN ALTAHIR BAKR

    Yüksek Lisans

    Türkçe

    Türkçe

    2022

    Elektrik ve Elektronik Mühendisliğiİstanbul Üniversitesi-Cerrahpaşa

    Elektrik ve Elektronik Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ RANA ORTAÇ KABAOĞLU

  5. Prediction of corona-virus infection by using deep learning and machine learning

    Derin öğrenme ve makine öğrenmeyle korona-virüs enfeksiyonunun tahmini

    LAITH IBRAHIM SALIH AL-ALI

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Okan Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. PINAR YILDIRIM