Geri Dön

Comparison of dimensionality reduction techniques applied to driving event dataset

Sürüş olayları veri setinde boyut indirgeme tekniklerinin karşılaştırılması

  1. Tez No: 447110
  2. Yazar: CAN ÇETİN
  3. Danışmanlar: PROF. DR. TANKUT ACARMAN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2016
  8. Dil: İngilizce
  9. Üniversite: Galatasaray Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 50

Özet

Veri madenciliği veya makina öğrenmesi gibi veri inceleme yöntemleriyle kesin çözüm getirilemeyen belirsiz alanlarda çalışmalar yapılırken, veri özelliklerinin sınıflandırma üzerindeki etkileri genellikle bilinmez. Özellikler arasındaki bağımlılık, özelliğin sıfır veya düşük varyansa sahip olması, özelliğin üzerindeki aykırı uç veya kayıp veriler yüzünden sınıflandırma başarıları düşebilir. Sınıflandırma başarısını arttırmak ve sağlıklı sınıflandırma için, özellik boyut indirgemesi için, öznitelik arama veya özellik alt küme seçimi yöntemleri kullanılmaktadır. Özellik alt küme seçimi ve boyut indirgemesi, özellik uzayındaki özellik kümesini indirgemek için kullanılan iki farklı yöntemdir. Özellik alt küme seçiminde, daha etkin öznitelikler bulunurken, boyut indirgemesinde orjinal özellik kümesinden lineer veya lineer olmayan kombinasyonlar yardımıyla yeni öznitelikler üretilir. İki yöntemde sınıflandırma, gruplama ve regresyon problemlerini incelemede kullanılmaktadır. Boyut türetme yöntemi, hali hazırdaki özelliklerden yeni öznitelikler oluşturarak problemin tanımlanabilirliğinden fedakarlık gösterir. Özellik alt küme seçimi yöntemi ise, en iyi özellik kümesi seçmek için, daha az önemli özellikleri eleme yöntemini seçer. Bu yöntemler istenen sınıflandırma başarısı için yeterli değilse, sınıflandırma başarısını arttırmak için veya veri uzayında sınıflandırma için önemli parametreleri bulup onları daha fazla anlamlandırmak için kullanılmalıdır.

Özet (Çeviri)

When investigating on problematical and indefinite areas with data exploring tools such as machine learning or DM algorithms, weight of data attributes effecting classification result is generally unknown issue. Using entire feature set might cause the low classification success. Dependency existance among features, (near) zero variance features, outlier and missing data on feature may harm classification accuracy. To increase classification success and learn feature effect on classification, dimension reduction techniques such as feature subset selection and feature extraction are used. Feature subset selection and feature extraction are the two different applied methods for reducing the dimension set. While feature subset selection methods is focusing to find the most important features that affect the classification result, feature extraction methods are dealing with the creating of new attributes as a linear or non linear combination of initial feature set. Both methods are used on the investigation of classification, clustering and regression problems. Feature extraction methods sacrifice the explanation of the problems, when they combine the existent features to create new ones. On the other hand, features subset selection methods help to pick the most important features by ordering attributes according to their ranking methods. If classification researches are not satisfying or contribution of the attributes that affecting the classification is not known deeply, both methods can be used to understanding the importance of the attributes, and increase classification accuracy.

Benzer Tezler

  1. Özellik seçimi algoritmaları kullanılarak heyelanda etkili faktörlerin belirlenmesi ve heyelan duyarlılık haritalarının üretilmesi

    Determination of effective factors using feature selection algorithms and production of landslide susceptibility maps

    EMREHAN KUTLUĞ ŞAHİN

    Doktora

    Türkçe

    Türkçe

    2017

    Jeodezi ve Fotogrametriİstanbul Teknik Üniversitesi

    Geomatik Mühendisliği Ana Bilim Dalı

    PROF. DR. CENGİZHAN İPBÜKER

    PROF. DR. TAŞKIN KAVZOĞLU

  2. İstatistiksel varyans prosedürü ile bütünleşik analitik hiyerarşi prosesi: Çok kriterli kuruluş yeri seçiminde bir uygulama

    Statistical variance procedure based analytical hierarcy process: An application on multicriteria facility location selection

    HALİT ALPER TAYALI

    Doktora

    Türkçe

    Türkçe

    2016

    İstatistikİstanbul Üniversitesi

    İşletme Ana Bilim Dalı

    PROF. DR. MEHPARE TİMOR

    PROF. DR. NECDET ÖZÇAKAR

  3. Development of machine learning algorithm for identification of vestibular system disorders

    Vestibüler sistem bozukluklarının teşhisi için makine öğrenimi algoritması geliştirilmesi

    SADDAM HEYDAROV

    Yüksek Lisans

    İngilizce

    İngilizce

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Kontrol ve Otomasyon Mühendisliği Ana Bilim Dalı

    DOÇ. DR. SERHAT İKİZOĞLU

  4. Yüz tanıma: Öz yüzler yapay sinir ağları, Gabor dalgacık dönüşümü yöntemleri

    Face recognition: Eigenfaces, neural networks, Gabor wavelet approaches

    HALİT ERGEZER

    Yüksek Lisans

    Türkçe

    Türkçe

    2003

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBaşkent Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. KRASSİMİR IANKOV

  5. Comparison of machine learning algorithms for financial evaluations

    Finansal değerlendirmeler için makine öğrenmesi algoritmalarının karşılaştırılması

    WUDAY COLLEY

    Yüksek Lisans

    İngilizce

    İngilizce

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGebze Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    ASSOC. DR. MEHMET GÖKTÜRK