Yoğunluk tabanlı veri kümeleme algoritmaları üzerine

On the data clustering algorithms based on density

PDF İndir

Tez No: 526880
Yazar: AYŞE GÜLNAZ KAYA
Danışmanlar: PROF. DR. URFAT NURIYEV
Tez Türü: Yüksek Lisans
Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Matematik, Computer Engineering and Computer Science and Control, Mathematics
Anahtar Kelimeler: Veri Madenciliği, Kümeleme Analizi, Yoğunluğa Dayalı Kümeleme, C# Programlama Dili, Hesaplama Denemeleri, Data Mining, Clustering Analysis, Density-Based Clustering, C# Programming Language, Experimental Results
Yıl: 2018
Dil: Türkçe
Üniversite: Ege Üniversitesi
Enstitü: Fen Bilimleri Enstitüsü
Ana Bilim Dalı: Matematik Ana Bilim Dalı
Bilim Dalı: Belirtilmemiş.
Sayfa Sayısı: 107

Özet

Teknolojinin hızla gelişimi, elde edilen ve saklanan verilerin sayısının büyük boyutlara ulaşmasına neden olmuştur. Veri boyutlarındaki hızlı artış, saklanan verilerin anlamsızlaşmasına sebep olmuş ve anlamlı bilgiye ulaşmayı zorlaştırmıştır. Bu problemi çözmek amacıyla veri madenciliği ortaya çıkmıştır. Veri madenciliğinin en sık kullanılan yöntemlerinden birisi kümeleme analizidir. Kümeleme analizi, önbilgi olmaksızın, veri seti içerisindeki doğal yapıların ortaya çıkarıldığı gibi veri seti içerisindeki ilişkilerin keşfedilebildiği bir süreçtir. Kümeleme analizinde en sık karşılaşılan problem, farklı şekillerdeki küme yapılarının keşfedilebilirliğidir. Gerçek dünya veri setleri, birçok farklı şekil ve yapıda kümeler içerebilmektedir. İyi bir kümeleme algoritmasından, farklı şekil ve yapıdaki kümeleri keşfedebilmesi beklenir. Bu problemi çözmek amacıyla, yoğunluk tabanlı kümeleme algoritmaları geliştirilmiştir. Bu tez çalışmasında, kümeleme analizi, kümeleme yöntemleri ve yoğunluğa dayalı kümeleme yaklaşımı detaylıca incelenmiştir. Yoğunluk tabanlı kümeleme problemi için yeni bir algoritma önerilmiş ve bu algoritmanın iki farklı versiyonu tanıtılmıştır. Tanıtılan algoritmalar, C# programlama dili kullanılarak hazırlanan bir program içerisinde çalıştırılmış; elde edilen sonuçlar, bu program üzerinde görselleştirilmiştir. Hazırlanan program aracılığı ile yapılan hesaplama denemeleri, dokuz adet gerçek veri seti üzerinde gerçekleştirilmiştir. Elde edilen sonuçlara göre, tanıtılan algoritmaların, farklı şekillere sahip sık ve iyi ayrılmış yapıdaki kümeleri başarı ile elde edebildiği gözlemlenmiştir.

Özet (Çeviri)

The rapid development of technology has led to a large number of obtained and stored data. The rapid increase in data sizes caused the stored data to become meaningless and makes it difficult to reach meaningful information. In order to solve this problem, data mining has emerged. One of the most frequently used methods of data mining is the clustering analysis. Clustering analysis is a process in which, without prior knowledge, natural structures in the data set are discovered and relationships in the data set can be discovered. The most common problem in clustering analysis is the discoverability of arbitrary shaped clusters. Real world datasets can contain clusters in many different shapes and structures. A good clustering algorithm is expected to be able to discover clusters with arbitrary shape and structures. In order to solve this problem, density-based clustering algorithms have been developed. In this thesis study, clustering analysis, clustering methods and clustering approach based on density have been examined in detail. A new algorithm is proposed for the density-based clustering problem and two different versions of this algorithm are introduced. The introduced algorithms were run in a program prepared using the C # software language; the results obtained are visualized on this program. Calculation experiments performed through the prepared program were performed on nine actual data sets. According to the obtained results, it has been observed that the introduced algorithms can successfully obtain clusters in compact and well separated structures with arbitrary shapes.

Benzer Tezler

Tez No
803918
Kümeleme yöntemleri ile müşteri kanal göçü analizi
Customer channel migration analysis with clustering methods
GİZEM ÇALIŞKAN
Yüksek Lisans
Türkçe
2023
Endüstri ve Endüstri Mühendisliği İstanbul Teknik Üniversitesi
Endüstri Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ MEHMET YASİN ULUKUŞ
Tez No
376240
Sağlık sektöründe aykırı verilerin algılanması ve yorumlanması için mekânsal-zamansal veri madenciliği kullanımı
Using of spatio-temporal data mining for trajectory outlier detection and interpretation in health care services
ŞEYMA YÜCEL ALTAY
Yüksek Lisans
Türkçe
2014
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol Atatürk Üniversitesi
Bilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. ABDULSAMET HAŞILOĞLU
Tez No
694559
Density-based and parameterless clustering of embedded data streams
Boyutu azaltılmış akan verinin yoğunluğa dayalı ve parametresiz kümelenmesi
ÖZLEM POYRAZ
Yüksek Lisans
İngilizce
2021
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol Orta Doğu Teknik Üniversitesi
Bilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. MEHMET VOLKAN ATALAY
Tez No
221364
Veri madenciliğinde kümeleme algoritmaları ve kümeleme analizi
Clustering algorithms in data mining and clustering analysis
YASEMİN KOLDERE AKIN
Doktora
Türkçe
2008
İstatistik Marmara Üniversitesi
Ekonometri Ana Bilim Dalı
PROF. DR. ŞAHAMET BÜLBÜL
Tez No
266135
Yoğunluk tabanlı kümeleme metodları kullanılarak paralel veri madenciliği gerçekleştirilmesi
Parallel data mining by using density based clustering methods
SÜLEYMAN ZAFER SEVER
Yüksek Lisans
Türkçe
2010
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol Maltepe Üniversitesi
Bilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. TURGAY TUGAY BİLGİN

Geri Dön