Mst-based cluster analysis: A New algorithm for determining inconsistent edges
Mst tabanlı küme analizi: Tutarsız kenarları belirlemek için yeni bir algoritma
- Tez No: 780706
- Danışmanlar: YRD. DOÇ. DR. AHMET ERCAN TOPCU
- Tez Türü: Doktora
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2021
- Dil: İngilizce
- Üniversite: Ankara Yıldırım Beyazıt Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Bilgisayar Bilimleri Bilim Dalı
- Sayfa Sayısı: 92
Özet
Son yıllarda grafik tabanlı veri kümeleme algoritmaları, orta nokta tabanlı bölümleme yerine bağlantı tabanlı gerçekleştirdikleri için popüler hale gelmektedir. Minimum yayılma ağacı (MST) tabanlı veri kümelemeyle ilgili yöntemler, MST grafiklerinden tutarsız kenarları ortadan kaldırarak rastgele kümelerin şekillerini tanıyabilen grafik tabanlı algoritma türleridir. Tüm MST tabanlı veri kümeleme algoritmalarında, tutarsız kenarların tanımlanması, ele alınması gereken ana sorundur. MST grafiklerinde en uzun kenarlar, ideal koşullar altında tutarsız kenarlar olarak kabul edilmektedir. Bununla birlikte, aykırı değerler gerçek veri kümelerinde genellikle bulunmakta ve bu da en uzun kenarları hatalı küme ayırma göstergeleri yapmaktadır. Bu çalışmada, MST ve kritik mesafe yöntemi kullanılarak yeni bir veri kümeleme algoritması önerilmektedir. Önerilen algoritma, MST tabanlı veri kümelemesinin ana sorununu, yani veri kümesinin bazı aykırı değerler içermesi durumunda bile kümeleri elde etmek için tutarsız kenarları tanımlama ve kaldırma sorununu çözmektedir. MST'yi Öklid mesafesine dayalı olarak belirli bir ağırlıklı grafik üzerinde inşa ederek başlar ve ardından kritik mesafeyi bir eşik olarak kullanarak tutarsız kenarları ortadan kaldırarak grafiği kümelere ayırmaktadır. Optimal kümeleri elde etmek için hem MST hem de kritik mesafe metodolojisinin avantajlarının entegrasyonu, bu çalışmanın ana katkısıdır. Farklı veri kümeleri kullanılarak gerçekleştirilen deneysel analiz ve sonuçlar, önerilen kümeleme algoritmamızın en yaygın veri kümeleme algoritmalarına kıyasla daha iyi genel performans sağladığını kanıtlamaktadır.
Özet (Çeviri)
In recent years, graph-based data clustering algorithms have become popular as they perform connectivity-based rather than centroid-based partitioning. Methods related to minimum spanning tree (MST)-based data clustering are types of graph-based algorithms that can recognize arbitrary shapes of clusters by eliminating inconsistent edges from MST graphs. In all MST-based data clustering algorithms, definition of inconsistent edges is the main problem that needs to be addressed. The longest edges in MST graphs are considered as inconsistent edges under ideal conditions. Nevertheless, outliers often exist in real-world tasks, which makes the longest edges inaccurate cluster separation indicators. In this study, we propose a new data clustering algorithm using MST and a critical distance method. The proposed algorithm solves the main issue of MST-based data clustering, namely identifying and removing inconsistent edges to obtain clusters even in the event that the dataset contains some outliers. It begins by constructing the MST over a given weighted graph based on Euclidean distance and then splits up the graph into clusters by eliminating inconsistent edges using critical distance as a threshold. Integration of the advantages of both MST and critical distance methodology to obtain optimal clusters is the main contribution of this work. The conducted experimental analysis and results using different datasets prove that our proposed clustering algorithm yields better overall performance compared with the most common data clustering algorithms.
Benzer Tezler
- Extending current techniques for electrical layout optimization of onshore wind farms considering 3d model of the terrain
Kara tipi rüzgar enerjisi santrallarının 3 boyutlu arazi modeli kullanarak elektrik tek hat optimizasyonu
KAAN DEVECİ
Yüksek Lisans
İngilizce
2018
Enerjiİstanbul Teknik ÜniversitesiEnerji Bilim ve Teknoloji Ana Bilim Dalı
DR. ÖĞR. ÜYESİ BURAK BARUTÇU
DOÇ. DR. EMRE ALPMAN
- An adaptive forecasting methodology by utilizing change point detection technique on time series
Değişim noktası saptama tekniği kullanarak adaptif tahminleme metodolojisi
ALI NASER NAEIMI AVVAL
Yüksek Lisans
İngilizce
2020
Endüstri ve Endüstri Mühendisliğiİstanbul Teknik ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ÖMER FARUK BEYCA
- Terörden etkilenen ülkeler arasındaki topolojik ve hiyerarşik ilişkilerin incelenmesi
Investigation of topological and hierarchical relationships between the countries affected by terrorism
ÇİĞDEM GÜVEN
Yüksek Lisans
Türkçe
2024
Fizik ve Fizik MühendisliğiNevşehir Hacı Bektaş Veli ÜniversitesiFizik Ana Bilim Dalı
PROF. DR. BAYRAM DEVİREN
- Network structure analysis
Ağ yapıları analizi
YAĞMUR YAVUZ
Yüksek Lisans
İngilizce
2020
MatematikGalatasaray ÜniversitesiMatematik Ana Bilim Dalı
DOÇ. DR. AYŞEGÜL ULUS
- Hiyerarşik yapı yöntemleri kullanılarak önemli para birimleri arasındaki ilişkilerin topolojik analizi
Topological analysis of the correlations among major currencies by using hierarchical structure methods
YUSUF KOCAKAPLAN
Yüksek Lisans
Türkçe
2011
Fizik ve Fizik MühendisliğiErciyes ÜniversitesiFizik Ana Bilim Dalı
PROF. DR. MUSTAFA KESKİN