Geri Dön

Uzaklık ölçülerinin kümeleme analizine olan etkilerinin incelenmesi ve geliştirilmesi

An investigation of effects on cluster analysis of distance measurements and improvement

  1. Tez No: 275549
  2. Yazar: MURAT ERİŞOĞLU
  3. Danışmanlar: PROF. DR. SADULLAH SAKALLIOĞLU
  4. Tez Türü: Doktora
  5. Konular: İstatistik, Statistics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2011
  8. Dil: Türkçe
  9. Üniversite: Çukurova Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: İstatistik Bölümü
  12. Bilim Dalı: İstatistik Ana Bilim Dalı
  13. Sayfa Sayısı: 217

Özet

Uzaklık ölçülerinin kümelemeye etkisinin incelendiği bu çalışmada farklı birçok disiplinde yaygın olarak kullanılan ve geniş bir literatüre sahip olan kümeleme analizinde yer alan tekniklerde uygun uzaklık ölçülerinin kullanılmasıyla, tekniklerini kümeleme performanslarının arttırılması amaçlanmıştır. Bu amaçla yeni önerilen iki uzaklık ölçüsü ve literatürde geniş bir kullanıma sahip mevcut beş uzaklık ölçüsünün kümeleme performansları hem farklı özellikler taşıyan gerçek veri setlerinde hem de simülasyon çalışmasıyla incelenmiştir. Çalışmada aşamalı kümeleme teknikleri içerisinde basitliği ve etkinliği açısından en fazla kullanılan ve bilinen k-ortalamalar tekniğinde uygun küme sayısının belirlenmesi ve küme başlangıç merkezlerinin seçimi için yeni algoritmalar önerilmiştir. Önerilen algoritmaların performansı literatürde yer alan mevcut algoritmalar ile karşılaştırılmış ve önerilen algoritmaların performansının daha iyi olduğu görülmüştür. Çalışma kapsamında ayrıca standartlaştırma ve kümeleme öncesi boyut indirgemenin kümelemeye olan etkisi simülasyon çalışması ile ortaya konmuştur.

Özet (Çeviri)

Cluster analysis is a multivariate statistical analysis that widely used in many different disciplines and with a wide range of literature. In this study, the effects of the distance measurements on cluster analysis will be investigated. In this study, our goal is clustering techniques to increase performance when the use of appropriate distance measures in clustering. To study the effects on cluster analysis of distance measures used in both simulation and real data sets. k-means algorithm is the most well known and the fast methods in non-hierarchical cluster algorithms. Because of the simplicity of k-means algorithm, this algorithm is used in various fields. Also in this study, a new method is developed for choosing the number of clusters and an algorithm to compute initial cluster centers for k-means algorithm. Moreover in this study we also showed that the effectiveness of clustering high dimensional data using principal components instead of original variables and the effectiveness of clustering high dimensional data using standardized variables instead of original variables

Benzer Tezler

  1. Uzaklık ve benzerlik ölçülerinin kümeleme sonuçlarına etkisi

    The effect of distance and similarity measures on clustering

    ÖZLEM ERGÜT

    Yüksek Lisans

    Türkçe

    Türkçe

    2011

    İstatistikMarmara Üniversitesi

    Ekonometri Ana Bilim Dalı

    DOÇ. DR. AHMET METE ÇİLİNGİRTÜRK

  2. Uzaklık ve benzerlik ölçülerinin istatistik alanındaki kullanımı

    The usage of dissimilarity and similarity measures in statistics

    HASAN YILDIRIM

    Yüksek Lisans

    Türkçe

    Türkçe

    2015

    İstatistikÇukurova Üniversitesi

    İstatistik Ana Bilim Dalı

    PROF. DR. SADULLAH SAKALLIOĞLU

  3. Bazı bitki uçucu yağlarının in vitro gerçek sindirilebilirlik, bakteri ve protozoa sayısına etkileri bakımından hiyerarşik kümeleme yöntemleriyle sınıflandırılması

    The classification of plant extracts using hierarchical cluster methods for bakteria and protozoa number in rumen

    MEHMET KEZİBAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2010

    ZiraatÇukurova Üniversitesi

    Zootekni Ana Bilim Dalı

    PROF. DR. ZEYNEL CEBECİ

  4. Q seviyeli bulanık küme temelli tedarikçi performans değerlendirmesi

    Performance evaluation of suppliers based on Q-rung orthopair fuzzy sets

    ADEM PINAR

    Doktora

    Türkçe

    Türkçe

    2020

    İşletmeGazi Üniversitesi

    Tedarik ve Lojistik Yönetimi Ana Bilim Dalı

    DOÇ. DR. FATİH EMRE BORAN

  5. Clustering of manifold-modeled data based on tangent space variations

    Manifold modelli datanın tanjant uzayı değişikliklerine dayalı kümelenmesi

    GÖKHAN GÖKDOĞAN

    Yüksek Lisans

    İngilizce

    İngilizce

    2017

    Elektrik ve Elektronik MühendisliğiOrta Doğu Teknik Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. ELİF VURAL