Geri Dön

Stretch: A feature weighting method for the k nearest neighbor algorithms

Stretch : En yakın k komşu algoritması için veri özelliklerinin önemini belirleme yöntemi

  1. Tez No: 216330
  2. Yazar: MEHMET ALİ YATBAZ
  3. Danışmanlar: YRD. DOÇ. DR. DENİZ YURET
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2007
  8. Dil: İngilizce
  9. Üniversite: Koç Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Bölümü
  12. Bilim Dalı: Elektrik ve Bilgisayar Mühendisliği Ana Bilim Dalı
  13. Sayfa Sayısı: 93

Özet

En yakın k komşu algoritması (EKK) uzun süreli çalışılmış parametresiz sınıflandırmaalgoritmalarındandır. EKK sınıflandırılmış örnek verilerin dağılımının altında yatan birleşik olasılıkyoğunluk fonksiyonunun bilinmediğini kabul eder ve bu fonksiyonu sınıflandırılmış örnek verilerikullanarak ölçümler. Her ne kadar bu varsayım pratikte karşılaşılan problemler açısından gerçekçi biryaklaşım olsa da EKK'nin sınıflandırma doğruluğu, veri depolama miktarı ve hesaplama zamanıüzerinde olumsuz etkilere sebep olur.Bu tezin amacı EKK algoritmasının anlaşılması ve EKK'nin sınıflandırma doğruluğununarttırılması için kullanılan yöntemlerin incelenmesidir. Bu tez esas olarak verilerin sahip olduğu ilgisizözelliklerin EKK algoritmasının sinıflandırma doğruluğuna olan etkisi üzerine yoğunlaşmıs ve busorunu çözmek amaçlı Stretch adında yeni bir yöntem önermiştir. Bu yöntem sınıflandırma öncesindeörnek veriler üzerinde dogrusal dönüşumler uygulayarak EKK'nin sınıflandırma doğruluğunuarttırmayı amaçlar. Başka bir değişle, Stretch örnek verileri kullanarak EKK algoritmasınınsınıflandırma doğrulu ğunu en yuksek büyüklüğe çıkartacak doğrusal dönüşümleri adım adım hesaplar.Bu yöntem her adımda örnek sınıflandırılmış veriler arasından bir veri seçer ve bu veriyi kendi ile aynısınıftaki verilerle yakınlaştıracak ve/veya kendisi ile farklı sınıflardaki verilerle uzaklaştıracak olandoğrusal dönüşümü hesaplar. Farklı adımlarda oluşturulmuş bu doğrusal dönuşümlerin bileşimi olansonuç doğrusal dönüşümü EKK algoritmasının sınıflandırma doğruluğu üzerinde istatiksel olarakkayda değer bir artış gösterir.

Özet (Çeviri)

The k nearest neighbor learning algorithm (kNN) is one of the well studied nonparametriclearning algorithms. kNN assumes that the underlying joint probability density function of the trainingset is unknown and it estimates the underlying joint probability density functions using the labeled dataset (training set). Although this is a realistic assumption in terms of the real world problems, itintroduces some limitations on the predictive accuracy, the storage complexity and computationalcomplexity of the kNN.The goal of this thesis is to understand kNN and techniques that are used to increase thepredictive accuracy of kNN. This thesis mainly focuses on the effect of the irrelevant features on thepredictive accuracy of the kNN and introduces the Stretch method, a new preprocessing method toincrease the predictive accuracy of kNN by doing linear transformation on the training data matrix. Themethod incrementally constructs a linear transformation that maximizes the nearest neighborclassification accuracy on the training set. At each iteration the method picks an instance from the dataset, and computes a transformation that moves the instance closer to the instances with the samecategory and/or away from the instances in other categories. The composition of these iterative lineartransformations can lead to statistically significant improvements in kNN learning algorithms.

Benzer Tezler

  1. Düz kasların kasılma kinetiğinin küçük ve büyük genlikli uzunluk uyarılarıyla incelenmesi

    Başlık çevirisi yok

    ÜLKÜ ÇÖMELEKOĞLU

    Doktora

    Türkçe

    Türkçe

    1994

    BiyofizikHacettepe Üniversitesi

    Biyofizik Ana Bilim Dalı

    DOÇ.DR. NECLA ÖZTÜRK

  2. Depo dijital olgunluk modelinin oluşturulması ve uygulanması

    Creation and implementation of the warehouse digital maturity model

    İLKNUR YARDIMCI COŞKUN

    Doktora

    Türkçe

    Türkçe

    2023

    Endüstri ve Endüstri Mühendisliğiİstanbul Teknik Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    DOÇ. DR. MURAT BASKAK

  3. Denim giyside ısıl düzenleme özelliğinin geliştirilmesi

    Improving thermal regulation property of denim garment

    ELİF GÖZDE SARAÇ

    Yüksek Lisans

    Türkçe

    Türkçe

    2015

    Tekstil ve Tekstil MühendisliğiÇukurova Üniversitesi

    Tekstil Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. FÜSUN DOBA KADEM

  4. Üç farklı protein kaynağı kullanılarak üretilen yenilebilir filmlerin peynir raf ömrü üzerindeki etkisinin incelenmesi

    Three different protein films to evaluate the changes in the quality of cheese samples

    GÖZDE KAYA

    Yüksek Lisans

    Türkçe

    Türkçe

    2017

    Gıda Mühendisliğiİstanbul Aydın Üniversitesi

    Gıda Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. ZEYNEP TACER CABA