Geri Dön

K-en yakın komşu algoritmasında ağırlıklı Öklid mesafesi ölçümüne yenilikçi bir yaklaşım

An innovative approach to weighted Euclidean distance measurement in the K-nearest neighbor algorithm

  1. Tez No: 881378
  2. Yazar: ALİ İHSAN ÇETİN
  3. Danışmanlar: PROF. DR. ALİ HAKAN BÜYÜKLÜ
  4. Tez Türü: Doktora
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, İstatistik, Computer Engineering and Computer Science and Control, Statistics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2024
  8. Dil: Türkçe
  9. Üniversite: Yıldız Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: İstatistik Ana Bilim Dalı
  12. Bilim Dalı: İstatistik Bilim Dalı
  13. Sayfa Sayısı: 98

Özet

Makine öğrenimi teknolojileri arasında popüler algoritmalardan biri k-En Yakın Komşular (kNN)'dır. Bu çalışmada kNN'in geliştirilmiş bir versiyonu olan Özellik Önemi Aşılanmış k-En Yakın Komşular (FIIkNN) algoritması önerilmiştir. Çalışma, özellikle finans sektöründen alınan altı farklı veri seti üzerinde yürütülmüş olup, bu veri setleri çeşitli öznitelik sayılarına ve yeniden örnekleme tekniklerine tabi tutularak detaylı bir şekilde analiz edilmiştir. Analizler FIIkNN ve kNN algoritmalarının sonuçlarını karşılaştırmaktadır. Araştırmanın amacı, FIIkNN modelinin, geleneksel kNN algoritmasına kıyasla sınıflandırma doğruluğunu artırma potansiyelini değerlendirmek ve özellikle çeşitli veri kümelerindeki performansını incelemektir. Bu bağlamda, modeller 3, 5 ve 7 olmak üzere farklı 'k' değerlerinde ve 2, 4, 6, 10, 18 öznitelik sayılarında 500, 700 ve 1000 kez yeniden örnekleme yapılarak test edilmiştir. Bulgular, özellikle öznitelik sayısı düşükken FIIkNN algoritmasının kNN'ye göre daha yüksek doğruluk oranlarına ulaştığını göstermiştir. Özellikle düşük öznitelik sayılarında FIIkNN, varsayılan parametreli kNN algoritmasından belirgin şekilde daha iyi performans sergilemiştir. Ayrıca, artan 'k' değerleriyle her iki modelin stabilitesi ve doğruluk oranı iyileşmiş, bu da daha fazla komşunun dikkate alınmasının etkinliğini vurgulamıştır. Sonuç olarak, bu tez çalışması önerilen FIIkNN modelinin, özellik önemini dikkate alarak daha etkin sınıflandırmalar yapabildiğini hem yüksek hem de düşük boyutlu veri setlerinde özellik seçimini optimize ederek verimli bir şekilde çalışabildiğini ortaya koymaktadır.

Özet (Çeviri)

Among machine learning technologies, the k-Nearest Neighbors (kNN) algorithm is one of the popular methods. This study introduces an enhanced version of kNN, known as Feature Importance Infused k-Nearest Neighbors (FIIkNN). The research has been conducted using six different datasets from the finance sector, which were subjected to various feature counts and resampling techniques for in-depth analysis. The analyses compare the results of the FIIkNN and traditional kNN algorithms. The aim of the research is to assess the potential of the FIIkNN model to improve classification accuracy compared to the conventional kNN algorithm, especially in various datasets. In this context, the models were tested using 3, 5, and 7 as 'k' values and 2, 4, 6, 10, and 18 feature counts across 500, 700, and 1000 resamplings. Findings indicate that FIIkNN achieves higher accuracy rates than kNN as the number of features decreases. Particularly in models with fewer features, FIIkNN significantly outperforms the classical kNN algorithm with default parameters. Additionally, as the 'k' values increase, both models show improved stability and accuracy rates, highlighting the effectiveness of considering more neighbors. In conclusion, this thesis study demonstrates that the proposed FIIkNN model can perform more effective classifications by taking into account the importance of features, and it operates efficiently by optimizing feature selection in both high and low-dimensional datasets.

Benzer Tezler

  1. Yapay sinir ağlarında öğrenme algoritmalarının analizi

    Analysis of learning algorithms in neural networks

    SEVİNÇ BAKLAVACI

  2. Veri madenciliğinde farklı karar ağaçları ve k-en yakın komşuluk yöntemlerinin incelenmesi: kadın hastalıkları ve doğum verisinde bir uygulama

    Investigation of different decision trees and k-nearest neighbor methods in data mining: An application on gynecology and birth data

    SADİ ELASAN

    Doktora

    Türkçe

    Türkçe

    2019

    BiyoistatistikVan Yüzüncü Yıl Üniversitesi

    Biyoistatistik Ana Bilim Dalı

    PROF. DR. SIDDIK KESKİN

  3. Feature weighting problem in K-nearest neighbor classifier

    K-en yakın komşu sınıflandırma algoritmasında özellik ağırlıklandırma problemi

    NURULLAH GÜLEÇ

    Yüksek Lisans

    İngilizce

    İngilizce

    2017

    Endüstri ve Endüstri MühendisliğiOrta Doğu Teknik Üniversitesi

    Yöneylem Araştırması Ana Bilim Dalı

    DOÇ. DR. CEM İYİGÜN

  4. Batch learning of disjoint feature intervals

    Ayrık öznitelik bölüntülerini toplu öğrenme

    AYNUR AKKUŞ

  5. Türkçe sözcük anlam belirsizliği giderme

    Word sense disambiguation for Turkish

    BAHAR İLGEN

    Doktora

    Türkçe

    Türkçe

    2015

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. EŞREF ADALI

    YRD. DOÇ. DR. AHMET CÜNEYD TANTUĞ