Geri Dön

Yoğunluk tabanlı veri kümeleme algoritmaları üzerine

On the data clustering algorithms based on density

  1. Tez No: 526880
  2. Yazar: AYŞE GÜLNAZ KAYA
  3. Danışmanlar: PROF. DR. URFAT NURIYEV
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Matematik, Computer Engineering and Computer Science and Control, Mathematics
  6. Anahtar Kelimeler: Veri Madenciliği, Kümeleme Analizi, Yoğunluğa Dayalı Kümeleme, C# Programlama Dili, Hesaplama Denemeleri, Data Mining, Clustering Analysis, Density-Based Clustering, C# Programming Language, Experimental Results
  7. Yıl: 2018
  8. Dil: Türkçe
  9. Üniversite: Ege Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Matematik Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 107

Özet

Teknolojinin hızla gelişimi, elde edilen ve saklanan verilerin sayısının büyük boyutlara ulaşmasına neden olmuştur. Veri boyutlarındaki hızlı artış, saklanan verilerin anlamsızlaşmasına sebep olmuş ve anlamlı bilgiye ulaşmayı zorlaştırmıştır. Bu problemi çözmek amacıyla veri madenciliği ortaya çıkmıştır. Veri madenciliğinin en sık kullanılan yöntemlerinden birisi kümeleme analizidir. Kümeleme analizi, önbilgi olmaksızın, veri seti içerisindeki doğal yapıların ortaya çıkarıldığı gibi veri seti içerisindeki ilişkilerin keşfedilebildiği bir süreçtir. Kümeleme analizinde en sık karşılaşılan problem, farklı şekillerdeki küme yapılarının keşfedilebilirliğidir. Gerçek dünya veri setleri, birçok farklı şekil ve yapıda kümeler içerebilmektedir. İyi bir kümeleme algoritmasından, farklı şekil ve yapıdaki kümeleri keşfedebilmesi beklenir. Bu problemi çözmek amacıyla, yoğunluk tabanlı kümeleme algoritmaları geliştirilmiştir. Bu tez çalışmasında, kümeleme analizi, kümeleme yöntemleri ve yoğunluğa dayalı kümeleme yaklaşımı detaylıca incelenmiştir. Yoğunluk tabanlı kümeleme problemi için yeni bir algoritma önerilmiş ve bu algoritmanın iki farklı versiyonu tanıtılmıştır. Tanıtılan algoritmalar, C# programlama dili kullanılarak hazırlanan bir program içerisinde çalıştırılmış; elde edilen sonuçlar, bu program üzerinde görselleştirilmiştir. Hazırlanan program aracılığı ile yapılan hesaplama denemeleri, dokuz adet gerçek veri seti üzerinde gerçekleştirilmiştir. Elde edilen sonuçlara göre, tanıtılan algoritmaların, farklı şekillere sahip sık ve iyi ayrılmış yapıdaki kümeleri başarı ile elde edebildiği gözlemlenmiştir.

Özet (Çeviri)

The rapid development of technology has led to a large number of obtained and stored data. The rapid increase in data sizes caused the stored data to become meaningless and makes it difficult to reach meaningful information. In order to solve this problem, data mining has emerged. One of the most frequently used methods of data mining is the clustering analysis. Clustering analysis is a process in which, without prior knowledge, natural structures in the data set are discovered and relationships in the data set can be discovered. The most common problem in clustering analysis is the discoverability of arbitrary shaped clusters. Real world datasets can contain clusters in many different shapes and structures. A good clustering algorithm is expected to be able to discover clusters with arbitrary shape and structures. In order to solve this problem, density-based clustering algorithms have been developed. In this thesis study, clustering analysis, clustering methods and clustering approach based on density have been examined in detail. A new algorithm is proposed for the density-based clustering problem and two different versions of this algorithm are introduced. The introduced algorithms were run in a program prepared using the C # software language; the results obtained are visualized on this program. Calculation experiments performed through the prepared program were performed on nine actual data sets. According to the obtained results, it has been observed that the introduced algorithms can successfully obtain clusters in compact and well separated structures with arbitrary shapes.

Benzer Tezler

  1. Kümeleme yöntemleri ile müşteri kanal göçü analizi

    Customer channel migration analysis with clustering methods

    GİZEM ÇALIŞKAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    Endüstri ve Endüstri Mühendisliğiİstanbul Teknik Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ MEHMET YASİN ULUKUŞ

  2. Sağlık sektöründe aykırı verilerin algılanması ve yorumlanması için mekânsal-zamansal veri madenciliği kullanımı

    Using of spatio-temporal data mining for trajectory outlier detection and interpretation in health care services

    ŞEYMA YÜCEL ALTAY

    Yüksek Lisans

    Türkçe

    Türkçe

    2014

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAtatürk Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ABDULSAMET HAŞILOĞLU

  3. Density-based and parameterless clustering of embedded data streams

    Boyutu azaltılmış akan verinin yoğunluğa dayalı ve parametresiz kümelenmesi

    ÖZLEM POYRAZ

    Yüksek Lisans

    İngilizce

    İngilizce

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. MEHMET VOLKAN ATALAY

  4. Veri madenciliğinde kümeleme algoritmaları ve kümeleme analizi

    Clustering algorithms in data mining and clustering analysis

    YASEMİN KOLDERE AKIN

    Doktora

    Türkçe

    Türkçe

    2008

    İstatistikMarmara Üniversitesi

    Ekonometri Ana Bilim Dalı

    PROF. DR. ŞAHAMET BÜLBÜL

  5. Yoğunluk tabanlı kümeleme metodları kullanılarak paralel veri madenciliği gerçekleştirilmesi

    Parallel data mining by using density based clustering methods

    SÜLEYMAN ZAFER SEVER

    Yüksek Lisans

    Türkçe

    Türkçe

    2010

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolMaltepe Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. TURGAY TUGAY BİLGİN