Subspace constraint clustering for semi- supervised sparse data
Yarı denetimli seyrek veriler için alt alan kısıtlaması kümelenmesi
- Tez No: 572179
- Danışmanlar: Prof. Dr. GÖLGE ÖGÜCÜ YETKİN
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Elektrik ve Elektronik Mühendisliği, Computer Engineering and Computer Science and Control, Electrical and Electronics Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2019
- Dil: İngilizce
- Üniversite: Gaziantep Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Elektronik ve Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 84
Özet
Birçok bilimsel alanın karmaşıklığı, yalnızca üretilen veri miktarını değil aynı zamanda verilerin kendisinin doğasını da etkilemiştir. Günümüzde, yüksek boyutlu veri kümeleriyle uğraşmak yaygındır. Bu tip veri setlerini işlemek ve analiz etmek, bazı kalıcı problemlerle karşılaşabileceği için büyük dikkat gerektirir. Verileri birkaç kümeye ayırmak veya gruplandırmak, veri madenciliği ve makine öğrenmesinde yaygın olarak kullanılan uygulamalardan biridir. Bu süreç kümeleme ile ifade edilir ve veri setinde sunulan temel bilgiler hakkında fikir verir. En yaygın kullanılan kümeleme algoritmalarından biri, normal şartlardaki sadeliği ve etkinliği nedeniyle k-aracıdır. Bununla birlikte, yüksek boyutlu verilerin niteliği göz önüne alındığında, k-araçları istenen sonuçları elde etmekte başarısız gözükmektedir. Buna temel olarak, üretilen kümelenmelere aykırı olanları engelleyen veri içindeki boyutsallık laneti ve olası gürültü neden olmaktadır. Olası bir çözüm olarak, seyrek veriler için boyutsallığın azaltılması önerilmiştir. Kümelenme uygulamaları için hem uzay hem de alt uzay tabanlarında boyutsallık azaltma elde edilebilir. Bununla birlikte, alt uzay boyutsallığının azaltılması, sağlamlığı ve kümelenebilirlik iyileştirmesi nedeniyle son çalışmalarda daha fazla dikkat çekmiştir. Böylece, bu araştırmada, seyrek veriler için yumuşak alt alan kümelemesinin araştırılmasına karar verilmiştir. Kümelenmesi zor veri kümelerinin kümelenmesinde performanslarını k araçlarıyla karşılaştırmak için mekanizma yönelimlerine göre dört algoritma seçilmiştir. Tüm kümeleme işlemlerini çalıştırmak ve hem sayısal hem de görsel sonuçlar üretmek için MATLAB 2018b kullanılarak bir Grafiksel Kullanıcı Arayüzü (GUI) uygulanmıştır. K-araçlarının performansının, yumuşak alt-alan hesaplama dahil edilerek çarpıcı bir şekilde geliştirilebileceği bulunmuştur. Özellikle, bu çalışmada ReliefF algoritması, bazı durumlarda kümeleme performansını% 50'den daha fazla değerlendirebilir.
Özet (Çeviri)
The complexity of many scientific fields has brought about its impact on not only the amount of generated data but also the nature of the data itself. Nowadays, it is common to deal with high-dimensional datasets. Processing and analyzing this type of datasets require extreme attention as several persistent problems can be faced. Grouping or partitioning data into a number of several sets is one of the applications widely used in data mining and machine learning. This process is referred to by clustering and it provides an idea on the underlying knowledge presented in the dataset. One of the most commonly used clustering algorithms is k-means, due to its simplicity and effectiveness in normal circumstances. However, considering the nature of high-dimensional data, k-means seems to fail in obtaining the desired results. This is mainly caused by the curse of dimensionality and possible noise within the data, which hinder the outliers of the produced clusters. As a possible solution, dimensionality reduction for sparse data has been proposed. Dimensionality reduction can be obtained on both space and subspace bases for clustering applications. However, subspace dimensionality reduction has attracted more attention in recent studies due to its robustness and clusterability improvement. Thus, in this research, it has been decided to investigate soft subspace clustering for sparse data. Four algorithms have been chosen, based on their mechanism orientation, to compare their performances with k-means in clustering hard-to-cluster datasets. A Graphical User Interface (GUI) has been implemented using MATLAB 2018b to run all clustering processes and to produce both numerical and visual results. It has been found that the performance of k-means can be dramatically improved through incorporating soft subspace computing. Particularly, ReliefF algorithm, in this study, could improve the clustering performance to more than 50% in some cases.
Benzer Tezler
- Variations on structured sparsity for machine learning
Makine öğrenimi için yapısal seyreklik üzerine çeşitlemeler
YİĞİT OKTAR
Doktora
İngilizce
2020
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİzmir Ekonomi ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ MEHMET TÜRKAN
- Radarla hedef tanıma ve sınıflandırma için temel bileşenler analizine dayalı yeni karma yöntemler
Novel hybrid methods based on pca for radar target recognition and classification
YAŞAR KARTAL
Yüksek Lisans
Türkçe
2018
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
PROF. DR. MURAT TAYFUN GÜNEL
- Perceptual audio source separation by subspace learning
Altuzay öğrenme ile algısal ses kaynak ayrıştırma
SERAP KIRBIZ
Doktora
İngilizce
2013
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
PROF. DR. BİLGE GÜNSEL
- State-space identification of switched linear systems via sparse optimization
Anahtarlamalı doğrusal sistemlerin seyreklik optimizasyonu ile durum-uzay tanılaması
FETHI BENCHERKI
Yüksek Lisans
İngilizce
2020
Elektrik ve Elektronik MühendisliğiAnadolu ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ SEMİHA TÜRKAY
- Robotization of hand woven carpet technology process
El dokuma halı teknoloji prosesinin robotizasyonu
ÖZGÜN SELVİ
Yüksek Lisans
İngilizce
2008
Makine Mühendisliğiİzmir Yüksek Teknoloji EnstitüsüMakine Mühendisliği Ana Bilim Dalı
PROF. DR. RASİM ALİZADE