Geri Dön

Uzaklık ve benzerlik ölçülerinin istatistik alanındaki kullanımı

The usage of dissimilarity and similarity measures in statistics

  1. Tez No: 382394
  2. Yazar: HASAN YILDIRIM
  3. Danışmanlar: PROF. DR. SADULLAH SAKALLIOĞLU
  4. Tez Türü: Yüksek Lisans
  5. Konular: İstatistik, Statistics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2015
  8. Dil: Türkçe
  9. Üniversite: Çukurova Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: İstatistik Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 108

Özet

Kümeleme analizi, doğal sınıflamaları hakkında açık bilgi bulunmayan durumlarda üzerinde çalışılan birimler topluluğunu, kendi içinde türdeş fakat diğerlerinden farklı olacak biçimde kümelere ayırma olanağı tanıyarak ana kitleye ilişkin tahminlerin yapılmasında yararlanılan çok değişkenli istatistiksel bir yöntem olarak tanımlanmaktadır (Sharma, 1996). Bu yöntemin etkinliğini belirlerken kullanılan uzaklık ölçüsü önem arz eder. Bu çalışmada da özellikle iki sonuçlu (binary) veri yapıları için uzaklık ve benzerlik ölçülerinin kümeleme analizi üzerindeki etkileri araştırılmış, geçerlilik kriteri olarak kofenetik korelasyon katsayısı kullanılmıştır. Bu amaçla literatürde tanımlanmış olan 37 benzerlik ve 10 uzaklık ölçüsü olmak üzere toplam 47 ölçüye bağlı olarak uzaklık matrisleri hem gerçek veri kümesi hem de yapay olarak üretilmiş dört farklı yapıdaki veri kümesi kullanılarak oluşturulmuş ve analizler sonuçlandırılmıştır. Ayrıca ikili uzaklık ve benzerlik ölçülerinin yapıları, ölçülerin sağlamaları önerilen birtakım teorik koşullara göre incelenmiştir. Bunun yanı sıra aşamalı kümeleme analizi yöntemleri incelenmiş, pratikte nasıl uygulanacağı gösterilmiştir. Elde edilen bulgular sonucunda Hamann, Russell&Rao, Chord ve Sokal&Sneath-1ölçüleri en iyi kümelenme yapısını ortaya koyan ölçüler olarak önerilmiştir.

Özet (Çeviri)

Cluster analysis is defined as a multivariate statistical method for grouping observations which are unknown about their classifications, into clusters such that the observations in each cluster or group are similar and the observations across groups are as different as possible and getting some estimations about populations (Sharma, 1996). Dissimilarity measures are important in determining the efficiency of this method. In this study, the effects of similarity and dissimilarity measures on cluster analysis is investigated for binary data sets and as a validity index or criteria, the cophenetic correlation coefficient is used. For this purpose, the distance matrix depending on each of 47 measures, which of 37 are similarity, 10 are dissimilarity measures, is generated by using both real data and four artificial data sets which have different features and these datasets are analyzed. Besides, structures of binary similarity and dissimilarity measures are examined in terms of some theoretical conditions which are proposed to be satisfied. In other respects hierarchical clustering analysing methods are explained and their practical applications are examplifed. As a result of the findings, Hamann, Russell&Rao, Chord and Sokal&Sneath-1 measures are suggested as the measures providing best clustering structure.

Benzer Tezler

  1. Farklı kümeleme tekniklerinin karşılaştırılması üzerine bir uygulama

    An application on the comparison of different clustering techniques

    CEREN CAMKIRAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2017

    BankacılıkMarmara Üniversitesi

    Ekonometri Ana Bilim Dalı

    PROF. DR. ŞAHAMET BÜLBÜL

  2. Türkiye'de sağlık açısından homojen il gruplarının belirlenmesine ilişkin istatistiksel bir yaklaşım

    A Statical approach on determining the homogenous province groups on health in Türkiye

    BAHATTİN HAMARAT

    Yüksek Lisans

    Türkçe

    Türkçe

    1998

    İstatistikAnadolu Üniversitesi

    İstatistik Ana Bilim Dalı

    PROF. DR. A. FUAT YÜZER

  3. Uzaklık ve benzerlik ölçülerinin kümeleme sonuçlarına etkisi

    The effect of distance and similarity measures on clustering

    ÖZLEM ERGÜT

    Yüksek Lisans

    Türkçe

    Türkçe

    2011

    İstatistikMarmara Üniversitesi

    Ekonometri Ana Bilim Dalı

    DOÇ. DR. AHMET METE ÇİLİNGİRTÜRK

  4. Çok değişkenli analizlerde kullanılan uzaklık ve benzerlik ölçütlerinin kullanım yerleri üzerine uygulamalı bir çalışma

    Distance and similarity measures wich were used and applicatedin multivariate analysis

    HARUN FATİH TOMBAK

    Yüksek Lisans

    Türkçe

    Türkçe

    1996

    İstatistikHacettepe Üniversitesi

    Biyoistatistik Ana Bilim Dalı

    DOÇ.DR. REHA ALPAR

  5. Bulanık kümeler için uzaklık ve benzerlik ölçülerinin bazı matlab uygulamaları

    Some matlab applications of distance and similarity measures for fuzzy sets

    ÖZGE KAYA

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    MatematikAfyon Kocatepe Üniversitesi

    Matematik Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ESRA GÜLLE