Bölümleyci kümeleme algoritmalarının farklı veri yoğunluklarında karşılaştırması
Comparison of partitioning-based clustering algorithms on differently distributed data
- Tez No: 355578
- Danışmanlar: YRD. DOÇ. DR. HACER KARACAN
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2013
- Dil: Türkçe
- Üniversite: Gazi Üniversitesi
- Enstitü: Bilişim Enstitüsü
- Ana Bilim Dalı: Bilgisayar Bilimleri Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 107
Özet
Teknolojinin yaygın kullanılmasının neticesinde hacmi her geçen gün artan büyük veri yığınları ortaya çıkmaya başlamıştır. Bu kadar büyük boyutta verinin analizi ve içindeki herhangi bir bilgiye ulaşmak basit inceleme yöntemleriyle oldukça zor olduğundan veri madenciliği devreye girmiştir. Veri madenciliği, çok büyük veri tabanlarından, önceden bilinemeyen, geçerli ve kullanılabilir bilginin çıkarılma işlemi olarak ifade edilmektedir. Başka bir deyişle veri madenciliği, çok büyük veri tabanlarındaki ya da veri ambarlarındaki veriler arasında bulunan ilişkiler, örüntüler, değişiklikler, sapma ve eğilimler, belirli yapılar gibi ilginç bilgilerin ortaya çıkarılması işlemidir. Veri madenciliği alanında son zamanlarda yaygın bir şekilde kullanılan yöntemlerden biri kümeleme yöntemidir. Kümeleme, veri setindeki bilgileri farklı kümelere ayırarak küme içindeki verilerin özelliklerinin benzerlik oranı minimum ve kümeler arasında benzerlik oranını maksimum yapmaktadır. Bu çalışmada bölümleyici kümeleme yöntemleri ele alınarak farklı dağılımlı veri setleri üzerinde bölümleyici kümeleme algoritmalarının karşılaştırması gerçekleştirilmiştir. Bölümleyici kümeleme algoritmaları arasından“k-means”ve“kernel k-means”algoritmaları seçilmiştir. Farklı dağılımlı veri setlerini kümeleyerek iki algoritmanın hızı, kümeleme kalitesi ve bellek kaplaması açısından bilgiler elde edilmiş ve bu bilgiler ışığında iki algoritmanın karşılaştırma sonuçları sunulmuştur.
Özet (Çeviri)
As a result of wide spread technology usage, large volumes of collected data began to emerge. It is impossible to discover and analyze any information in such large data collection, so data mining comes into play. Data mining is a process that discovers unpredictable and usable knowledge from databases. In other words, data mining is the process of finding relation patterns, changes, deviations and trends, as well as interesting information like specific structures from large databases. One of the widely used data mining methods is clustering, which divides the data set into different clusters while trying to make the likelihood ratio as minimum inside the cluster and as maximum among other clusters depending on the options in the database. In this study, partitioning-based clustering methods are compared by applying them on data sets with different distribution patterns. We used k-means and kernel k-means partitioning algorithms for clustering data sets. By applying clustering operations on differently distributed data sets we compared the speed, clustering quality and the size of memory used in clustering for these algorithms. The information that we gathered by this comparison is presented and discussed in the related sections of this thesis.
Benzer Tezler
- Öğretmen adaylarının bilişsel stillerinin öğrenme yaklaşımlarına etkisi
The effects of prospective teachers' cognitive styles on learning approaches
SEDAT ALTINTAŞ
Yüksek Lisans
Türkçe
2015
Eğitim ve ÖğretimMuğla Sıtkı Koçman ÜniversitesiEğitim Bilimleri Ana Bilim Dalı
DOÇ. DR. İZZET GÖRGEN
- Yabancılara Türkçe öğretimi kapsamında Moğol öğrencilerin Türkçe öğrenme durumunun altayistik yönden incelenmesi
In the context of teaching Turkish to foreigners the research of Mongolian students learning Turkish from the altaistic view
ŞİVA KOLÇAK
- Dezavantajlı gruplar bağlamında lise çağı gençliğinin sosyalleşmesinde sporun etkisi
The effect of sport on hi̇gh school pupils who have di̇sadvantages in terms of being socialized
AHMET ARSLAN
Yüksek Lisans
Türkçe
2015
SosyolojiDüzce ÜniversitesiBeden Eğitimi ve Spor Ana Bilim Dalı
YRD. DOÇ. DR. METİN KILIÇ
- Hakkari yöresine ait halk anlatılarının eğitsel değeri ve çocuk edebiyatı açısından incelenmesi
The educational valvo of the folk narrative of Hakkâri region and the analysed in terms of childrens literature
SEYHAN ÖZKAN
Yüksek Lisans
Türkçe
2015
Eğitim ve ÖğretimYüzüncü Yıl ÜniversitesiTürkçe Eğitimi Ana Bilim Dalı
YRD. DOÇ. DR. RAŞİT KOÇ
- Lâpseki ve yöresi ağızları (İnceleme metin sözlük)
The dialects of Lâpseki's region (Examination text dictionary)
BİRSEN DOĞAR
Yüksek Lisans
Türkçe
2015
DilbilimAdnan Menderes ÜniversitesiTürk Dili ve Edebiyatı Ana Bilim Dalı
YRD. DOÇ. DR. ALİ İHSAN YAPICI