Sıralı ölçeklerde değerlendiriciler-arası güvenirlik ölçüm yöntemlerinin karşılaştırılması

Comparison of inter-rater reliability measurement methods in ordinal scales

PDF İndir

Tez No: 395667
Yazar: NİLDEN TUTALAR
Danışmanlar: DOÇ. DR. BÜLENT ÇELİK
Tez Türü: Yüksek Lisans
Konular: Biyoistatistik, İstatistik, Biostatistics, Statistics
Anahtar Kelimeler: Belirtilmemiş.
Yıl: 2015
Dil: Türkçe
Üniversite: Gazi Üniversitesi
Enstitü: Fen Bilimleri Enstitüsü
Ana Bilim Dalı: İstatistik Ana Bilim Dalı
Bilim Dalı: Belirtilmemiş.
Sayfa Sayısı: 146

Özet

Tıp, sosyal bilimler, eğitim bilimleri, dil, vb. pek çok alanda son yirmi yıldır sıklıkla bahsi geçen bir analiz olan değerlendiriciler arası güvenirlik analizi çeşitli ölçek tipleri için geliştirilen birçok uyum katsayıyla gerçekleştirilebilmektedir. Sınıflama, sıralama, eşit aralıklı ve oranlama ölçme düzeyleri için geliştirilen mevcut uyum istatistikleri halen incelenmekte ve geliştirilmektedir. İki veya daha fazla değerlendiricinin sıralı ölçek üzerinde her deneği ayrı ayrı sınıflandırdığı durumlarla sıklıkla karşılaşılmaktadır. Birçok sıralı ölçek, bir deneğin belli bir duruma sahip olup olmadığını ortaya çıkarmada oldukça özneldir. Belirli bir sıralamaya sahip kategorilerden oluşan bir değerlendiriciler arası güvenirlik deneyinde iki veya daha fazla değerlendiricinin sübjektif veya belirli bir prosedürü takiben yapmış olduğu skorlamaların uyumunu ölçmek için literatürde çeşitli uyum istatistikleri önerilmiştir. Bunlar iki ve ikiden fazla değerlendirici için olmak üzere gruplandırılabilir. İki değerlendirici için, Cohen Ağırlıklandırılmış κ katsayısı, Scott Ağırlıklandırılmış π katsayısı, Brennan-Prediger uyum katsayısı, Kripendorff α katsayısı ve Gwet AC2 uyum katsayısı sıklıkla kullanılırken, ikiden fazla değerlendirici için ise Conger Ağırlıklandırılmış κ katsayısı, Fleiss Genelleştirilmiş κ katsayısı, Brennan-Prediger uyum katsayısı, Krippendorff α katsayısı ve Gwet AC2 uyum katsayısı kullanılmaktadır. Bu tezin amacı, sıralı ölçekli skorlamalara sahip durumlarda değerlendiriciler arasındaki uyumu ölçen uyum katsayılarının karşılaştırılması ve bu uyum katsayılarının gücünün değerlendirilmesidir. Gerçek veriler kullanılarak yapılan hesaplamalar sonucunda, Gwet AC2 katsayısının diğer uyum katsayıları içerisinde en büyük uyum değerini verdiği tespit edilmiştir. Uyum gücünün yorumlanmasında ise literatürdeki mevcut Landis ve Koch, Fleiss ve Altman kıyaslama ölçekleri ele alınarak Gwet (2014) alternatif kıyaslama yöntemi incelenmiştir. Herhangi bir uyum katsayısını direk olarak kıyaslama ölçekleriyle yorumlamaktan ziyade Gwet (2014) kıyaslama yöntemini kullanarak yorumlamanın istatistiksel olarak daha güvenilir olduğu tespit edilmiştir.

Özet (Çeviri)

Inter-rater reliability analysis that often mentioned in medical, social sciences, pedagogics, and linguistics e.t.c in the past few decades can be performed with several agreement coefficients that developed for various scale type. The current agreement coefficients that developed for nominal, ordinal, interval and ratio scales have been still researched and improved.The cases in which two or more raters separately classify each subject in a sample on an ordinal scale are frequently encountered. Many ordinal scales are quite subjective in determining about whether a subject has a certain condition or not. Many ordinal scales are quite subjective, such as the scale for diagnoses about whether a subject has a certain condition. In an inter-rater reliability experiment that consist of categories that having a particular order there are several agreement coefficients are proposed in the literature for measuring scores that are scored by two or more raters following a particular or subjective procedure. These are grouped in terms of two or more than two raters. For 2 raters case these are Cohen's Weighted κ (1968), Scott's Weighted π (1955), Brennan-Prediger B-P (1981), Krippendorff's α (1970, 1978, 2004) and Gwet's AC2 (2008). For more than 2 raters case these are Conger's Generalized Kappa (1980), Brennan-Prediger B-P (1981), Fleiss' Generalized κ (1971), Krippendorff's α (1970, 1978, 2004) and Gwet's AC2 (2008). This dissertation concerned with comparing agreement coefficients that measure agreement among raters in an ordinal scaled inter-rater reliability experiment and evaluating these coefficients' strength. As a result of calculations which done by using real data, it has been seen that Gwet AC2 yields the higher agreement value than the other coefficients. On the interpretation of the strength of agreement Gwet (2014) alternative benchmarking method is analyzed by comparing existing benchmarking scales such as Landis ve Koch, Fleiss and Altman in literature. It was determined that interpreting the strength of agreement by using Gwet benchmarking method is more reliable rather than interpreting it by directly comparing agreement coefficients with existing benchmarking scales.

Benzer Tezler

Tez No
872148
Retinopati muayenesi sırasında dinletilen farklı müziklerin prematüre bebeklerin ağrı ve konfor düzeyine etkisi: Randomize kontrollü çalışma
The effect of different music played during retinopathy examination on pain and comfort level of premature infants : A randomized controlled trial
GİZEM KIVRAK
Yüksek Lisans
Türkçe
2024
Hemşirelik Necmettin Erbakan Üniversitesi
Hemşirelik Ana Bilim Dalı
DR. ÖĞR. ÜYESİ SEMRA KÖSE
Tez No
872693
Pretermlerde orogastrik sonda takılması sırasında uygulanan kombine nonfarmakolojik yöntemlerin ağrı ve konfor düzeyine etkisi
The effect of combined nonpharmacological methods applied during orogastric tube insertion in preterms on pain and comfort level
SEVGİ GÜVEN
Yüksek Lisans
Türkçe
2024
Hemşirelik Dokuz Eylül Üniversitesi
Hemşirelik Ana Bilim Dalı
DOÇ. DR. GÜLÇİN ÖZALP GERÇEKER
Tez No
870168
Hipertansif Romatoid Artritli hastalarda kardiyak rehabilitasyonun etkinliği: Randomize kontrollü çalışma
The effectiveness of cardiac rehabilitation in Hypertensive Rheumatoid Arthritis patients: Randomized controlled study
ABDURRAHMAN KUTLUCA
Tıpta Uzmanlık
Türkçe
2024
Fiziksel Tıp ve Rehabilitasyon Sağlık Bilimleri Üniversitesi
Fiziksel Tıp ve Rehabilitasyon Ana Bilim Dalı
PROF. DR. SERAP TOMRUK SÜTBEYAZ
Tez No
442409
Multi-scale deformation and failure prediction of polycrystalline metals: A case study on impact and localization
Polikristal metallerin farklı ölçeklerde deformasyon ve kırılma öngörüsü: Darbe ve lokalizasyon üzerine vaka çalışması
MORAD MIRZAJANZADEH
Yüksek Lisans
İngilizce
2016
Makine Mühendisliği Koç Üniversitesi
Makine Mühendisliği Ana Bilim Dalı
Assoc. Prof. Dr. DEMİRCAN CANADİNÇ
Tez No
944430
Zorlu koşullarda öğretmen olmak: Keşfedici karma yöntem araştırması
Being a teacher in challenging conditions: An exploratory mixed methods study
RECEP ÜN
Yüksek Lisans
Türkçe
2025
Eğitim ve Öğretim Hatay Mustafa Kemal Üniversitesi
Eğitim Bilimleri Ana Bilim Dalı
PROF. DR. CELAL TEYYAR UĞURLU

Geri Dön