Uzaklık ve benzerlik ölçülerinin istatistik alanındaki kullanımı

The usage of dissimilarity and similarity measures in statistics

PDF İndir

Tez No: 382394
Yazar: HASAN YILDIRIM
Danışmanlar: PROF. DR. SADULLAH SAKALLIOĞLU
Tez Türü: Yüksek Lisans
Konular: İstatistik, Statistics
Anahtar Kelimeler: Belirtilmemiş.
Yıl: 2015
Dil: Türkçe
Üniversite: Çukurova Üniversitesi
Enstitü: Fen Bilimleri Enstitüsü
Ana Bilim Dalı: İstatistik Ana Bilim Dalı
Bilim Dalı: Belirtilmemiş.
Sayfa Sayısı: 108

Özet

Kümeleme analizi, doğal sınıflamaları hakkında açık bilgi bulunmayan durumlarda üzerinde çalışılan birimler topluluğunu, kendi içinde türdeş fakat diğerlerinden farklı olacak biçimde kümelere ayırma olanağı tanıyarak ana kitleye ilişkin tahminlerin yapılmasında yararlanılan çok değişkenli istatistiksel bir yöntem olarak tanımlanmaktadır (Sharma, 1996). Bu yöntemin etkinliğini belirlerken kullanılan uzaklık ölçüsü önem arz eder. Bu çalışmada da özellikle iki sonuçlu (binary) veri yapıları için uzaklık ve benzerlik ölçülerinin kümeleme analizi üzerindeki etkileri araştırılmış, geçerlilik kriteri olarak kofenetik korelasyon katsayısı kullanılmıştır. Bu amaçla literatürde tanımlanmış olan 37 benzerlik ve 10 uzaklık ölçüsü olmak üzere toplam 47 ölçüye bağlı olarak uzaklık matrisleri hem gerçek veri kümesi hem de yapay olarak üretilmiş dört farklı yapıdaki veri kümesi kullanılarak oluşturulmuş ve analizler sonuçlandırılmıştır. Ayrıca ikili uzaklık ve benzerlik ölçülerinin yapıları, ölçülerin sağlamaları önerilen birtakım teorik koşullara göre incelenmiştir. Bunun yanı sıra aşamalı kümeleme analizi yöntemleri incelenmiş, pratikte nasıl uygulanacağı gösterilmiştir. Elde edilen bulgular sonucunda Hamann, Russell&Rao, Chord ve Sokal&Sneath-1ölçüleri en iyi kümelenme yapısını ortaya koyan ölçüler olarak önerilmiştir.

Özet (Çeviri)

Cluster analysis is defined as a multivariate statistical method for grouping observations which are unknown about their classifications, into clusters such that the observations in each cluster or group are similar and the observations across groups are as different as possible and getting some estimations about populations (Sharma, 1996). Dissimilarity measures are important in determining the efficiency of this method. In this study, the effects of similarity and dissimilarity measures on cluster analysis is investigated for binary data sets and as a validity index or criteria, the cophenetic correlation coefficient is used. For this purpose, the distance matrix depending on each of 47 measures, which of 37 are similarity, 10 are dissimilarity measures, is generated by using both real data and four artificial data sets which have different features and these datasets are analyzed. Besides, structures of binary similarity and dissimilarity measures are examined in terms of some theoretical conditions which are proposed to be satisfied. In other respects hierarchical clustering analysing methods are explained and their practical applications are examplifed. As a result of the findings, Hamann, Russell&Rao, Chord and Sokal&Sneath-1 measures are suggested as the measures providing best clustering structure.

Benzer Tezler

Tez No
464480
Farklı kümeleme tekniklerinin karşılaştırılması üzerine bir uygulama
An application on the comparison of different clustering techniques
CEREN CAMKIRAN
Yüksek Lisans
Türkçe
2017
Bankacılık Marmara Üniversitesi
Ekonometri Ana Bilim Dalı
PROF. DR. ŞAHAMET BÜLBÜL
Tez No
68957
Türkiye'de sağlık açısından homojen il gruplarının belirlenmesine ilişkin istatistiksel bir yaklaşım
A Statical approach on determining the homogenous province groups on health in Türkiye
BAHATTİN HAMARAT
Yüksek Lisans
Türkçe
1998
İstatistik Anadolu Üniversitesi
İstatistik Ana Bilim Dalı
PROF. DR. A. FUAT YÜZER
Tez No
291467
Uzaklık ve benzerlik ölçülerinin kümeleme sonuçlarına etkisi
The effect of distance and similarity measures on clustering
ÖZLEM ERGÜT
Yüksek Lisans
Türkçe
2011
İstatistik Marmara Üniversitesi
Ekonometri Ana Bilim Dalı
DOÇ. DR. AHMET METE ÇİLİNGİRTÜRK
Tez No
48118
Çok değişkenli analizlerde kullanılan uzaklık ve benzerlik ölçütlerinin kullanım yerleri üzerine uygulamalı bir çalışma
Distance and similarity measures wich were used and applicatedin multivariate analysis
HARUN FATİH TOMBAK
Yüksek Lisans
Türkçe
1996
İstatistik Hacettepe Üniversitesi
Biyoistatistik Ana Bilim Dalı
DOÇ.DR. REHA ALPAR
Tez No
817439
Bulanık kümeler için uzaklık ve benzerlik ölçülerinin bazı matlab uygulamaları
Some matlab applications of distance and similarity measures for fuzzy sets
ÖZGE KAYA
Yüksek Lisans
Türkçe
2023
Matematik Afyon Kocatepe Üniversitesi
Matematik Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ESRA GÜLLE

Geri Dön