Sıralı ölçeklerde değerlendiriciler-arası güvenirlik ölçüm yöntemlerinin karşılaştırılması
Comparison of inter-rater reliability measurement methods in ordinal scales
- Tez No: 395667
- Danışmanlar: DOÇ. DR. BÜLENT ÇELİK
- Tez Türü: Yüksek Lisans
- Konular: Biyoistatistik, İstatistik, Biostatistics, Statistics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2015
- Dil: Türkçe
- Üniversite: Gazi Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: İstatistik Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 146
Özet
Tıp, sosyal bilimler, eğitim bilimleri, dil, vb. pek çok alanda son yirmi yıldır sıklıkla bahsi geçen bir analiz olan değerlendiriciler arası güvenirlik analizi çeşitli ölçek tipleri için geliştirilen birçok uyum katsayıyla gerçekleştirilebilmektedir. Sınıflama, sıralama, eşit aralıklı ve oranlama ölçme düzeyleri için geliştirilen mevcut uyum istatistikleri halen incelenmekte ve geliştirilmektedir. İki veya daha fazla değerlendiricinin sıralı ölçek üzerinde her deneği ayrı ayrı sınıflandırdığı durumlarla sıklıkla karşılaşılmaktadır. Birçok sıralı ölçek, bir deneğin belli bir duruma sahip olup olmadığını ortaya çıkarmada oldukça özneldir. Belirli bir sıralamaya sahip kategorilerden oluşan bir değerlendiriciler arası güvenirlik deneyinde iki veya daha fazla değerlendiricinin sübjektif veya belirli bir prosedürü takiben yapmış olduğu skorlamaların uyumunu ölçmek için literatürde çeşitli uyum istatistikleri önerilmiştir. Bunlar iki ve ikiden fazla değerlendirici için olmak üzere gruplandırılabilir. İki değerlendirici için, Cohen Ağırlıklandırılmış κ katsayısı, Scott Ağırlıklandırılmış π katsayısı, Brennan-Prediger uyum katsayısı, Kripendorff α katsayısı ve Gwet AC2 uyum katsayısı sıklıkla kullanılırken, ikiden fazla değerlendirici için ise Conger Ağırlıklandırılmış κ katsayısı, Fleiss Genelleştirilmiş κ katsayısı, Brennan-Prediger uyum katsayısı, Krippendorff α katsayısı ve Gwet AC2 uyum katsayısı kullanılmaktadır. Bu tezin amacı, sıralı ölçekli skorlamalara sahip durumlarda değerlendiriciler arasındaki uyumu ölçen uyum katsayılarının karşılaştırılması ve bu uyum katsayılarının gücünün değerlendirilmesidir. Gerçek veriler kullanılarak yapılan hesaplamalar sonucunda, Gwet AC2 katsayısının diğer uyum katsayıları içerisinde en büyük uyum değerini verdiği tespit edilmiştir. Uyum gücünün yorumlanmasında ise literatürdeki mevcut Landis ve Koch, Fleiss ve Altman kıyaslama ölçekleri ele alınarak Gwet (2014) alternatif kıyaslama yöntemi incelenmiştir. Herhangi bir uyum katsayısını direk olarak kıyaslama ölçekleriyle yorumlamaktan ziyade Gwet (2014) kıyaslama yöntemini kullanarak yorumlamanın istatistiksel olarak daha güvenilir olduğu tespit edilmiştir.
Özet (Çeviri)
Inter-rater reliability analysis that often mentioned in medical, social sciences, pedagogics, and linguistics e.t.c in the past few decades can be performed with several agreement coefficients that developed for various scale type. The current agreement coefficients that developed for nominal, ordinal, interval and ratio scales have been still researched and improved.The cases in which two or more raters separately classify each subject in a sample on an ordinal scale are frequently encountered. Many ordinal scales are quite subjective in determining about whether a subject has a certain condition or not. Many ordinal scales are quite subjective, such as the scale for diagnoses about whether a subject has a certain condition. In an inter-rater reliability experiment that consist of categories that having a particular order there are several agreement coefficients are proposed in the literature for measuring scores that are scored by two or more raters following a particular or subjective procedure. These are grouped in terms of two or more than two raters. For 2 raters case these are Cohen's Weighted κ (1968), Scott's Weighted π (1955), Brennan-Prediger B-P (1981), Krippendorff's α (1970, 1978, 2004) and Gwet's AC2 (2008). For more than 2 raters case these are Conger's Generalized Kappa (1980), Brennan-Prediger B-P (1981), Fleiss' Generalized κ (1971), Krippendorff's α (1970, 1978, 2004) and Gwet's AC2 (2008). This dissertation concerned with comparing agreement coefficients that measure agreement among raters in an ordinal scaled inter-rater reliability experiment and evaluating these coefficients' strength. As a result of calculations which done by using real data, it has been seen that Gwet AC2 yields the higher agreement value than the other coefficients. On the interpretation of the strength of agreement Gwet (2014) alternative benchmarking method is analyzed by comparing existing benchmarking scales such as Landis ve Koch, Fleiss and Altman in literature. It was determined that interpreting the strength of agreement by using Gwet benchmarking method is more reliable rather than interpreting it by directly comparing agreement coefficients with existing benchmarking scales.
Benzer Tezler
- Retinopati muayenesi sırasında dinletilen farklı müziklerin prematüre bebeklerin ağrı ve konfor düzeyine etkisi: Randomize kontrollü çalışma
The effect of different music played during retinopathy examination on pain and comfort level of premature infants : A randomized controlled trial
GİZEM KIVRAK
Yüksek Lisans
Türkçe
2024
HemşirelikNecmettin Erbakan ÜniversitesiHemşirelik Ana Bilim Dalı
DR. ÖĞR. ÜYESİ SEMRA KÖSE
- Hipertansif Romatoid Artritli hastalarda kardiyak rehabilitasyonun etkinliği: Randomize kontrollü çalışma
The effectiveness of cardiac rehabilitation in Hypertensive Rheumatoid Arthritis patients: Randomized controlled study
ABDURRAHMAN KUTLUCA
Tıpta Uzmanlık
Türkçe
2024
Fiziksel Tıp ve RehabilitasyonSağlık Bilimleri ÜniversitesiFiziksel Tıp ve Rehabilitasyon Ana Bilim Dalı
PROF. DR. SERAP TOMRUK SÜTBEYAZ
- Multi-scale deformation and failure prediction of polycrystalline metals: A case study on impact and localization
Polikristal metallerin farklı ölçeklerde deformasyon ve kırılma öngörüsü: Darbe ve lokalizasyon üzerine vaka çalışması
MORAD MIRZAJANZADEH
Yüksek Lisans
İngilizce
2016
Makine MühendisliğiKoç ÜniversitesiMakine Mühendisliği Ana Bilim Dalı
Assoc. Prof. Dr. DEMİRCAN CANADİNÇ
- Uygulama öğretmenlerinin mentorluk rollerinin müzik öğretmen adaylarının müzik öğretimi özyeterlik inancındaki değişime etkisi
The effect of mentoring roles of mentor teachers on the change in music preservice teachers' music teaching self-efficacy beliefs
PERİHAN ÜÇTEPE
Yüksek Lisans
Türkçe
2023
Eğitim ve ÖğretimBolu Abant İzzet Baysal ÜniversitesiEğitim Bilimleri Ana Bilim Dalı
PROF. DR. ZEKİ ARSAL
- Örgütsel güven, yıldırma ve örgütsel sinizmin, örgütsel bağlılıkla ilişkisi: Beden eğitimi ve spor öğretmenleri üzerine karma bir araştırma
The relation of organizational trust, mobbing and organizational cynicism with organizational commitment: A combined research on physical education and sports teachers
SAMET ZENGİN
Doktora
Türkçe
2020
Eğitim ve ÖğretimTrabzon ÜniversitesiBeden Eğitimi ve Spor Öğretmenliği Ana Bilim Dalı
DOÇ. DR. AKIN ÇELİK