Bölümleyci kümeleme algoritmalarının farklı veri yoğunluklarında karşılaştırması

Comparison of partitioning-based clustering algorithms on differently distributed data

PDF İndir

Tez No: 355578
Yazar: HUSSEİN ALİ RİDHA AL-ZAND
Danışmanlar: YRD. DOÇ. DR. HACER KARACAN
Tez Türü: Yüksek Lisans
Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
Anahtar Kelimeler: Belirtilmemiş.
Yıl: 2013
Dil: Türkçe
Üniversite: Gazi Üniversitesi
Enstitü: Bilişim Enstitüsü
Ana Bilim Dalı: Bilgisayar Bilimleri Ana Bilim Dalı
Bilim Dalı: Belirtilmemiş.
Sayfa Sayısı: 107

Özet

Teknolojinin yaygın kullanılmasının neticesinde hacmi her geçen gün artan büyük veri yığınları ortaya çıkmaya başlamıştır. Bu kadar büyük boyutta verinin analizi ve içindeki herhangi bir bilgiye ulaşmak basit inceleme yöntemleriyle oldukça zor olduğundan veri madenciliği devreye girmiştir. Veri madenciliği, çok büyük veri tabanlarından, önceden bilinemeyen, geçerli ve kullanılabilir bilginin çıkarılma işlemi olarak ifade edilmektedir. Başka bir deyişle veri madenciliği, çok büyük veri tabanlarındaki ya da veri ambarlarındaki veriler arasında bulunan ilişkiler, örüntüler, değişiklikler, sapma ve eğilimler, belirli yapılar gibi ilginç bilgilerin ortaya çıkarılması işlemidir. Veri madenciliği alanında son zamanlarda yaygın bir şekilde kullanılan yöntemlerden biri kümeleme yöntemidir. Kümeleme, veri setindeki bilgileri farklı kümelere ayırarak küme içindeki verilerin özelliklerinin benzerlik oranı minimum ve kümeler arasında benzerlik oranını maksimum yapmaktadır. Bu çalışmada bölümleyici kümeleme yöntemleri ele alınarak farklı dağılımlı veri setleri üzerinde bölümleyici kümeleme algoritmalarının karşılaştırması gerçekleştirilmiştir. Bölümleyici kümeleme algoritmaları arasından“k-means”ve“kernel k-means”algoritmaları seçilmiştir. Farklı dağılımlı veri setlerini kümeleyerek iki algoritmanın hızı, kümeleme kalitesi ve bellek kaplaması açısından bilgiler elde edilmiş ve bu bilgiler ışığında iki algoritmanın karşılaştırma sonuçları sunulmuştur.

Özet (Çeviri)

As a result of wide spread technology usage, large volumes of collected data began to emerge. It is impossible to discover and analyze any information in such large data collection, so data mining comes into play. Data mining is a process that discovers unpredictable and usable knowledge from databases. In other words, data mining is the process of finding relation patterns, changes, deviations and trends, as well as interesting information like specific structures from large databases. One of the widely used data mining methods is clustering, which divides the data set into different clusters while trying to make the likelihood ratio as minimum inside the cluster and as maximum among other clusters depending on the options in the database. In this study, partitioning-based clustering methods are compared by applying them on data sets with different distribution patterns. We used k-means and kernel k-means partitioning algorithms for clustering data sets. By applying clustering operations on differently distributed data sets we compared the speed, clustering quality and the size of memory used in clustering for these algorithms. The information that we gathered by this comparison is presented and discussed in the related sections of this thesis.

Benzer Tezler

Tez No
412172
Öğretmen adaylarının bilişsel stillerinin öğrenme yaklaşımlarına etkisi
The effects of prospective teachers' cognitive styles on learning approaches
SEDAT ALTINTAŞ
Yüksek Lisans
Türkçe
2015
Eğitim ve Öğretim Muğla Sıtkı Koçman Üniversitesi
Eğitim Bilimleri Ana Bilim Dalı
DOÇ. DR. İZZET GÖRGEN
Tez No
412426
Yabancılara Türkçe öğretimi kapsamında Moğol öğrencilerin Türkçe öğrenme durumunun altayistik yönden incelenmesi
In the context of teaching Turkish to foreigners the research of Mongolian students learning Turkish from the altaistic view
ŞİVA KOLÇAK
Yüksek Lisans
Türkçe
2015
Dilbilim Marmara Üniversitesi
Türkçe Eğitimi Ana Bilim Dalı
PROF. DR. MESUT ŞEN
Tez No
412775
Dezavantajlı gruplar bağlamında lise çağı gençliğinin sosyalleşmesinde sporun etkisi
The effect of sport on hi̇gh school pupils who have di̇sadvantages in terms of being socialized
AHMET ARSLAN
Yüksek Lisans
Türkçe
2015
Sosyoloji Düzce Üniversitesi
Beden Eğitimi ve Spor Ana Bilim Dalı
YRD. DOÇ. DR. METİN KILIÇ
Tez No
413649
Hakkari yöresine ait halk anlatılarının eğitsel değeri ve çocuk edebiyatı açısından incelenmesi
The educational valvo of the folk narrative of Hakkâri region and the analysed in terms of childrens literature
SEYHAN ÖZKAN
Yüksek Lisans
Türkçe
2015
Eğitim ve Öğretim Yüzüncü Yıl Üniversitesi
Türkçe Eğitimi Ana Bilim Dalı
YRD. DOÇ. DR. RAŞİT KOÇ
Tez No
413996
Lâpseki ve yöresi ağızları (İnceleme metin sözlük)
The dialects of Lâpseki's region (Examination text dictionary)
BİRSEN DOĞAR
Yüksek Lisans
Türkçe
2015
Dilbilim Adnan Menderes Üniversitesi
Türk Dili ve Edebiyatı Ana Bilim Dalı
YRD. DOÇ. DR. ALİ İHSAN YAPICI

Geri Dön