Geri Dön

Bölümleyci kümeleme algoritmalarının farklı veri yoğunluklarında karşılaştırması

Comparison of partitioning-based clustering algorithms on differently distributed data

  1. Tez No: 355578
  2. Yazar: HUSSEİN ALİ RİDHA AL-ZAND
  3. Danışmanlar: YRD. DOÇ. DR. HACER KARACAN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2013
  8. Dil: Türkçe
  9. Üniversite: Gazi Üniversitesi
  10. Enstitü: Bilişim Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Bilimleri Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 107

Özet

Teknolojinin yaygın kullanılmasının neticesinde hacmi her geçen gün artan büyük veri yığınları ortaya çıkmaya başlamıştır. Bu kadar büyük boyutta verinin analizi ve içindeki herhangi bir bilgiye ulaşmak basit inceleme yöntemleriyle oldukça zor olduğundan veri madenciliği devreye girmiştir. Veri madenciliği, çok büyük veri tabanlarından, önceden bilinemeyen, geçerli ve kullanılabilir bilginin çıkarılma işlemi olarak ifade edilmektedir. Başka bir deyişle veri madenciliği, çok büyük veri tabanlarındaki ya da veri ambarlarındaki veriler arasında bulunan ilişkiler, örüntüler, değişiklikler, sapma ve eğilimler, belirli yapılar gibi ilginç bilgilerin ortaya çıkarılması işlemidir. Veri madenciliği alanında son zamanlarda yaygın bir şekilde kullanılan yöntemlerden biri kümeleme yöntemidir. Kümeleme, veri setindeki bilgileri farklı kümelere ayırarak küme içindeki verilerin özelliklerinin benzerlik oranı minimum ve kümeler arasında benzerlik oranını maksimum yapmaktadır. Bu çalışmada bölümleyici kümeleme yöntemleri ele alınarak farklı dağılımlı veri setleri üzerinde bölümleyici kümeleme algoritmalarının karşılaştırması gerçekleştirilmiştir. Bölümleyici kümeleme algoritmaları arasından“k-means”ve“kernel k-means”algoritmaları seçilmiştir. Farklı dağılımlı veri setlerini kümeleyerek iki algoritmanın hızı, kümeleme kalitesi ve bellek kaplaması açısından bilgiler elde edilmiş ve bu bilgiler ışığında iki algoritmanın karşılaştırma sonuçları sunulmuştur.

Özet (Çeviri)

As a result of wide spread technology usage, large volumes of collected data began to emerge. It is impossible to discover and analyze any information in such large data collection, so data mining comes into play. Data mining is a process that discovers unpredictable and usable knowledge from databases. In other words, data mining is the process of finding relation patterns, changes, deviations and trends, as well as interesting information like specific structures from large databases. One of the widely used data mining methods is clustering, which divides the data set into different clusters while trying to make the likelihood ratio as minimum inside the cluster and as maximum among other clusters depending on the options in the database. In this study, partitioning-based clustering methods are compared by applying them on data sets with different distribution patterns. We used k-means and kernel k-means partitioning algorithms for clustering data sets. By applying clustering operations on differently distributed data sets we compared the speed, clustering quality and the size of memory used in clustering for these algorithms. The information that we gathered by this comparison is presented and discussed in the related sections of this thesis.

Benzer Tezler

  1. Öğretmen adaylarının bilişsel stillerinin öğrenme yaklaşımlarına etkisi

    The effects of prospective teachers' cognitive styles on learning approaches

    SEDAT ALTINTAŞ

    Yüksek Lisans

    Türkçe

    Türkçe

    2015

    Eğitim ve ÖğretimMuğla Sıtkı Koçman Üniversitesi

    Eğitim Bilimleri Ana Bilim Dalı

    DOÇ. DR. İZZET GÖRGEN

  2. Yabancılara Türkçe öğretimi kapsamında Moğol öğrencilerin Türkçe öğrenme durumunun altayistik yönden incelenmesi

    In the context of teaching Turkish to foreigners the research of Mongolian students learning Turkish from the altaistic view

    ŞİVA KOLÇAK

    Yüksek Lisans

    Türkçe

    Türkçe

    2015

    DilbilimMarmara Üniversitesi

    Türkçe Eğitimi Ana Bilim Dalı

    PROF. DR. MESUT ŞEN

  3. Dezavantajlı gruplar bağlamında lise çağı gençliğinin sosyalleşmesinde sporun etkisi

    The effect of sport on hi̇gh school pupils who have di̇sadvantages in terms of being socialized

    AHMET ARSLAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2015

    SosyolojiDüzce Üniversitesi

    Beden Eğitimi ve Spor Ana Bilim Dalı

    YRD. DOÇ. DR. METİN KILIÇ

  4. Hakkari yöresine ait halk anlatılarının eğitsel değeri ve çocuk edebiyatı açısından incelenmesi

    The educational valvo of the folk narrative of Hakkâri region and the analysed in terms of childrens literature

    SEYHAN ÖZKAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2015

    Eğitim ve ÖğretimYüzüncü Yıl Üniversitesi

    Türkçe Eğitimi Ana Bilim Dalı

    YRD. DOÇ. DR. RAŞİT KOÇ

  5. Lâpseki ve yöresi ağızları (İnceleme metin sözlük)

    The dialects of Lâpseki's region (Examination text dictionary)

    BİRSEN DOĞAR

    Yüksek Lisans

    Türkçe

    Türkçe

    2015

    DilbilimAdnan Menderes Üniversitesi

    Türk Dili ve Edebiyatı Ana Bilim Dalı

    YRD. DOÇ. DR. ALİ İHSAN YAPICI