Comparison of dimensionality reduction techniques applied to driving event dataset
Sürüş olayları veri setinde boyut indirgeme tekniklerinin karşılaştırılması
- Tez No: 447110
- Danışmanlar: PROF. DR. TANKUT ACARMAN
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2016
- Dil: İngilizce
- Üniversite: Galatasaray Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 50
Özet
Veri madenciliği veya makina öğrenmesi gibi veri inceleme yöntemleriyle kesin çözüm getirilemeyen belirsiz alanlarda çalışmalar yapılırken, veri özelliklerinin sınıflandırma üzerindeki etkileri genellikle bilinmez. Özellikler arasındaki bağımlılık, özelliğin sıfır veya düşük varyansa sahip olması, özelliğin üzerindeki aykırı uç veya kayıp veriler yüzünden sınıflandırma başarıları düşebilir. Sınıflandırma başarısını arttırmak ve sağlıklı sınıflandırma için, özellik boyut indirgemesi için, öznitelik arama veya özellik alt küme seçimi yöntemleri kullanılmaktadır. Özellik alt küme seçimi ve boyut indirgemesi, özellik uzayındaki özellik kümesini indirgemek için kullanılan iki farklı yöntemdir. Özellik alt küme seçiminde, daha etkin öznitelikler bulunurken, boyut indirgemesinde orjinal özellik kümesinden lineer veya lineer olmayan kombinasyonlar yardımıyla yeni öznitelikler üretilir. İki yöntemde sınıflandırma, gruplama ve regresyon problemlerini incelemede kullanılmaktadır. Boyut türetme yöntemi, hali hazırdaki özelliklerden yeni öznitelikler oluşturarak problemin tanımlanabilirliğinden fedakarlık gösterir. Özellik alt küme seçimi yöntemi ise, en iyi özellik kümesi seçmek için, daha az önemli özellikleri eleme yöntemini seçer. Bu yöntemler istenen sınıflandırma başarısı için yeterli değilse, sınıflandırma başarısını arttırmak için veya veri uzayında sınıflandırma için önemli parametreleri bulup onları daha fazla anlamlandırmak için kullanılmalıdır.
Özet (Çeviri)
When investigating on problematical and indefinite areas with data exploring tools such as machine learning or DM algorithms, weight of data attributes effecting classification result is generally unknown issue. Using entire feature set might cause the low classification success. Dependency existance among features, (near) zero variance features, outlier and missing data on feature may harm classification accuracy. To increase classification success and learn feature effect on classification, dimension reduction techniques such as feature subset selection and feature extraction are used. Feature subset selection and feature extraction are the two different applied methods for reducing the dimension set. While feature subset selection methods is focusing to find the most important features that affect the classification result, feature extraction methods are dealing with the creating of new attributes as a linear or non linear combination of initial feature set. Both methods are used on the investigation of classification, clustering and regression problems. Feature extraction methods sacrifice the explanation of the problems, when they combine the existent features to create new ones. On the other hand, features subset selection methods help to pick the most important features by ordering attributes according to their ranking methods. If classification researches are not satisfying or contribution of the attributes that affecting the classification is not known deeply, both methods can be used to understanding the importance of the attributes, and increase classification accuracy.
Benzer Tezler
- Özellik seçimi algoritmaları kullanılarak heyelanda etkili faktörlerin belirlenmesi ve heyelan duyarlılık haritalarının üretilmesi
Determination of effective factors using feature selection algorithms and production of landslide susceptibility maps
EMREHAN KUTLUĞ ŞAHİN
Doktora
Türkçe
2017
Jeodezi ve Fotogrametriİstanbul Teknik ÜniversitesiGeomatik Mühendisliği Ana Bilim Dalı
PROF. DR. CENGİZHAN İPBÜKER
PROF. DR. TAŞKIN KAVZOĞLU
- İstatistiksel varyans prosedürü ile bütünleşik analitik hiyerarşi prosesi: Çok kriterli kuruluş yeri seçiminde bir uygulama
Statistical variance procedure based analytical hierarcy process: An application on multicriteria facility location selection
HALİT ALPER TAYALI
Doktora
Türkçe
2016
İstatistikİstanbul Üniversitesiİşletme Ana Bilim Dalı
PROF. DR. MEHPARE TİMOR
PROF. DR. NECDET ÖZÇAKAR
- Development of machine learning algorithm for identification of vestibular system disorders
Vestibüler sistem bozukluklarının teşhisi için makine öğrenimi algoritması geliştirilmesi
SADDAM HEYDAROV
Yüksek Lisans
İngilizce
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiKontrol ve Otomasyon Mühendisliği Ana Bilim Dalı
DOÇ. DR. SERHAT İKİZOĞLU
- Yüz tanıma: Öz yüzler yapay sinir ağları, Gabor dalgacık dönüşümü yöntemleri
Face recognition: Eigenfaces, neural networks, Gabor wavelet approaches
HALİT ERGEZER
Yüksek Lisans
Türkçe
2003
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBaşkent ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. KRASSİMİR IANKOV
- Comparison of machine learning algorithms for financial evaluations
Finansal değerlendirmeler için makine öğrenmesi algoritmalarının karşılaştırılması
WUDAY COLLEY
Yüksek Lisans
İngilizce
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGebze Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
ASSOC. DR. MEHMET GÖKTÜRK