Uzaklık ve benzerlik ölçülerinin istatistik alanındaki kullanımı
The usage of dissimilarity and similarity measures in statistics
- Tez No: 382394
- Danışmanlar: PROF. DR. SADULLAH SAKALLIOĞLU
- Tez Türü: Yüksek Lisans
- Konular: İstatistik, Statistics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2015
- Dil: Türkçe
- Üniversite: Çukurova Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: İstatistik Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 108
Özet
Kümeleme analizi, doğal sınıflamaları hakkında açık bilgi bulunmayan durumlarda üzerinde çalışılan birimler topluluğunu, kendi içinde türdeş fakat diğerlerinden farklı olacak biçimde kümelere ayırma olanağı tanıyarak ana kitleye ilişkin tahminlerin yapılmasında yararlanılan çok değişkenli istatistiksel bir yöntem olarak tanımlanmaktadır (Sharma, 1996). Bu yöntemin etkinliğini belirlerken kullanılan uzaklık ölçüsü önem arz eder. Bu çalışmada da özellikle iki sonuçlu (binary) veri yapıları için uzaklık ve benzerlik ölçülerinin kümeleme analizi üzerindeki etkileri araştırılmış, geçerlilik kriteri olarak kofenetik korelasyon katsayısı kullanılmıştır. Bu amaçla literatürde tanımlanmış olan 37 benzerlik ve 10 uzaklık ölçüsü olmak üzere toplam 47 ölçüye bağlı olarak uzaklık matrisleri hem gerçek veri kümesi hem de yapay olarak üretilmiş dört farklı yapıdaki veri kümesi kullanılarak oluşturulmuş ve analizler sonuçlandırılmıştır. Ayrıca ikili uzaklık ve benzerlik ölçülerinin yapıları, ölçülerin sağlamaları önerilen birtakım teorik koşullara göre incelenmiştir. Bunun yanı sıra aşamalı kümeleme analizi yöntemleri incelenmiş, pratikte nasıl uygulanacağı gösterilmiştir. Elde edilen bulgular sonucunda Hamann, Russell&Rao, Chord ve Sokal&Sneath-1ölçüleri en iyi kümelenme yapısını ortaya koyan ölçüler olarak önerilmiştir.
Özet (Çeviri)
Cluster analysis is defined as a multivariate statistical method for grouping observations which are unknown about their classifications, into clusters such that the observations in each cluster or group are similar and the observations across groups are as different as possible and getting some estimations about populations (Sharma, 1996). Dissimilarity measures are important in determining the efficiency of this method. In this study, the effects of similarity and dissimilarity measures on cluster analysis is investigated for binary data sets and as a validity index or criteria, the cophenetic correlation coefficient is used. For this purpose, the distance matrix depending on each of 47 measures, which of 37 are similarity, 10 are dissimilarity measures, is generated by using both real data and four artificial data sets which have different features and these datasets are analyzed. Besides, structures of binary similarity and dissimilarity measures are examined in terms of some theoretical conditions which are proposed to be satisfied. In other respects hierarchical clustering analysing methods are explained and their practical applications are examplifed. As a result of the findings, Hamann, Russell&Rao, Chord and Sokal&Sneath-1 measures are suggested as the measures providing best clustering structure.
Benzer Tezler
- Farklı kümeleme tekniklerinin karşılaştırılması üzerine bir uygulama
An application on the comparison of different clustering techniques
CEREN CAMKIRAN
Yüksek Lisans
Türkçe
2017
BankacılıkMarmara ÜniversitesiEkonometri Ana Bilim Dalı
PROF. DR. ŞAHAMET BÜLBÜL
- Türkiye'de sağlık açısından homojen il gruplarının belirlenmesine ilişkin istatistiksel bir yaklaşım
A Statical approach on determining the homogenous province groups on health in Türkiye
BAHATTİN HAMARAT
Yüksek Lisans
Türkçe
1998
İstatistikAnadolu Üniversitesiİstatistik Ana Bilim Dalı
PROF. DR. A. FUAT YÜZER
- Uzaklık ve benzerlik ölçülerinin kümeleme sonuçlarına etkisi
The effect of distance and similarity measures on clustering
ÖZLEM ERGÜT
Yüksek Lisans
Türkçe
2011
İstatistikMarmara ÜniversitesiEkonometri Ana Bilim Dalı
DOÇ. DR. AHMET METE ÇİLİNGİRTÜRK
- Çok değişkenli analizlerde kullanılan uzaklık ve benzerlik ölçütlerinin kullanım yerleri üzerine uygulamalı bir çalışma
Distance and similarity measures wich were used and applicatedin multivariate analysis
HARUN FATİH TOMBAK
Yüksek Lisans
Türkçe
1996
İstatistikHacettepe ÜniversitesiBiyoistatistik Ana Bilim Dalı
DOÇ.DR. REHA ALPAR
- Bulanık kümeler için uzaklık ve benzerlik ölçülerinin bazı matlab uygulamaları
Some matlab applications of distance and similarity measures for fuzzy sets
ÖZGE KAYA
Yüksek Lisans
Türkçe
2023
MatematikAfyon Kocatepe ÜniversitesiMatematik Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ESRA GÜLLE