Geri Dön

Sıralı ölçeklerde değerlendiriciler-arası güvenirlik ölçüm yöntemlerinin karşılaştırılması

Comparison of inter-rater reliability measurement methods in ordinal scales

  1. Tez No: 395667
  2. Yazar: NİLDEN TUTALAR
  3. Danışmanlar: DOÇ. DR. BÜLENT ÇELİK
  4. Tez Türü: Yüksek Lisans
  5. Konular: Biyoistatistik, İstatistik, Biostatistics, Statistics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2015
  8. Dil: Türkçe
  9. Üniversite: Gazi Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: İstatistik Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 146

Özet

Tıp, sosyal bilimler, eğitim bilimleri, dil, vb. pek çok alanda son yirmi yıldır sıklıkla bahsi geçen bir analiz olan değerlendiriciler arası güvenirlik analizi çeşitli ölçek tipleri için geliştirilen birçok uyum katsayıyla gerçekleştirilebilmektedir. Sınıflama, sıralama, eşit aralıklı ve oranlama ölçme düzeyleri için geliştirilen mevcut uyum istatistikleri halen incelenmekte ve geliştirilmektedir. İki veya daha fazla değerlendiricinin sıralı ölçek üzerinde her deneği ayrı ayrı sınıflandırdığı durumlarla sıklıkla karşılaşılmaktadır. Birçok sıralı ölçek, bir deneğin belli bir duruma sahip olup olmadığını ortaya çıkarmada oldukça özneldir. Belirli bir sıralamaya sahip kategorilerden oluşan bir değerlendiriciler arası güvenirlik deneyinde iki veya daha fazla değerlendiricinin sübjektif veya belirli bir prosedürü takiben yapmış olduğu skorlamaların uyumunu ölçmek için literatürde çeşitli uyum istatistikleri önerilmiştir. Bunlar iki ve ikiden fazla değerlendirici için olmak üzere gruplandırılabilir. İki değerlendirici için, Cohen Ağırlıklandırılmış κ katsayısı, Scott Ağırlıklandırılmış π katsayısı, Brennan-Prediger uyum katsayısı, Kripendorff α katsayısı ve Gwet AC2 uyum katsayısı sıklıkla kullanılırken, ikiden fazla değerlendirici için ise Conger Ağırlıklandırılmış κ katsayısı, Fleiss Genelleştirilmiş κ katsayısı, Brennan-Prediger uyum katsayısı, Krippendorff α katsayısı ve Gwet AC2 uyum katsayısı kullanılmaktadır. Bu tezin amacı, sıralı ölçekli skorlamalara sahip durumlarda değerlendiriciler arasındaki uyumu ölçen uyum katsayılarının karşılaştırılması ve bu uyum katsayılarının gücünün değerlendirilmesidir. Gerçek veriler kullanılarak yapılan hesaplamalar sonucunda, Gwet AC2 katsayısının diğer uyum katsayıları içerisinde en büyük uyum değerini verdiği tespit edilmiştir. Uyum gücünün yorumlanmasında ise literatürdeki mevcut Landis ve Koch, Fleiss ve Altman kıyaslama ölçekleri ele alınarak Gwet (2014) alternatif kıyaslama yöntemi incelenmiştir. Herhangi bir uyum katsayısını direk olarak kıyaslama ölçekleriyle yorumlamaktan ziyade Gwet (2014) kıyaslama yöntemini kullanarak yorumlamanın istatistiksel olarak daha güvenilir olduğu tespit edilmiştir.

Özet (Çeviri)

Inter-rater reliability analysis that often mentioned in medical, social sciences, pedagogics, and linguistics e.t.c in the past few decades can be performed with several agreement coefficients that developed for various scale type. The current agreement coefficients that developed for nominal, ordinal, interval and ratio scales have been still researched and improved.The cases in which two or more raters separately classify each subject in a sample on an ordinal scale are frequently encountered. Many ordinal scales are quite subjective in determining about whether a subject has a certain condition or not. Many ordinal scales are quite subjective, such as the scale for diagnoses about whether a subject has a certain condition. In an inter-rater reliability experiment that consist of categories that having a particular order there are several agreement coefficients are proposed in the literature for measuring scores that are scored by two or more raters following a particular or subjective procedure. These are grouped in terms of two or more than two raters. For 2 raters case these are Cohen's Weighted κ (1968), Scott's Weighted π (1955), Brennan-Prediger B-P (1981), Krippendorff's α (1970, 1978, 2004) and Gwet's AC2 (2008). For more than 2 raters case these are Conger's Generalized Kappa (1980), Brennan-Prediger B-P (1981), Fleiss' Generalized κ (1971), Krippendorff's α (1970, 1978, 2004) and Gwet's AC2 (2008). This dissertation concerned with comparing agreement coefficients that measure agreement among raters in an ordinal scaled inter-rater reliability experiment and evaluating these coefficients' strength. As a result of calculations which done by using real data, it has been seen that Gwet AC2 yields the higher agreement value than the other coefficients. On the interpretation of the strength of agreement Gwet (2014) alternative benchmarking method is analyzed by comparing existing benchmarking scales such as Landis ve Koch, Fleiss and Altman in literature. It was determined that interpreting the strength of agreement by using Gwet benchmarking method is more reliable rather than interpreting it by directly comparing agreement coefficients with existing benchmarking scales.

Benzer Tezler

  1. Retinopati muayenesi sırasında dinletilen farklı müziklerin prematüre bebeklerin ağrı ve konfor düzeyine etkisi: Randomize kontrollü çalışma

    The effect of different music played during retinopathy examination on pain and comfort level of premature infants : A randomized controlled trial

    GİZEM KIVRAK

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    HemşirelikNecmettin Erbakan Üniversitesi

    Hemşirelik Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ SEMRA KÖSE

  2. Hipertansif Romatoid Artritli hastalarda kardiyak rehabilitasyonun etkinliği: Randomize kontrollü çalışma

    The effectiveness of cardiac rehabilitation in Hypertensive Rheumatoid Arthritis patients: Randomized controlled study

    ABDURRAHMAN KUTLUCA

    Tıpta Uzmanlık

    Türkçe

    Türkçe

    2024

    Fiziksel Tıp ve RehabilitasyonSağlık Bilimleri Üniversitesi

    Fiziksel Tıp ve Rehabilitasyon Ana Bilim Dalı

    PROF. DR. SERAP TOMRUK SÜTBEYAZ

  3. Multi-scale deformation and failure prediction of polycrystalline metals: A case study on impact and localization

    Polikristal metallerin farklı ölçeklerde deformasyon ve kırılma öngörüsü: Darbe ve lokalizasyon üzerine vaka çalışması

    MORAD MIRZAJANZADEH

    Yüksek Lisans

    İngilizce

    İngilizce

    2016

    Makine MühendisliğiKoç Üniversitesi

    Makine Mühendisliği Ana Bilim Dalı

    Assoc. Prof. Dr. DEMİRCAN CANADİNÇ

  4. Uygulama öğretmenlerinin mentorluk rollerinin müzik öğretmen adaylarının müzik öğretimi özyeterlik inancındaki değişime etkisi

    The effect of mentoring roles of mentor teachers on the change in music preservice teachers' music teaching self-efficacy beliefs

    PERİHAN ÜÇTEPE

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    Eğitim ve ÖğretimBolu Abant İzzet Baysal Üniversitesi

    Eğitim Bilimleri Ana Bilim Dalı

    PROF. DR. ZEKİ ARSAL

  5. Örgütsel güven, yıldırma ve örgütsel sinizmin, örgütsel bağlılıkla ilişkisi: Beden eğitimi ve spor öğretmenleri üzerine karma bir araştırma

    The relation of organizational trust, mobbing and organizational cynicism with organizational commitment: A combined research on physical education and sports teachers

    SAMET ZENGİN

    Doktora

    Türkçe

    Türkçe

    2020

    Eğitim ve ÖğretimTrabzon Üniversitesi

    Beden Eğitimi ve Spor Öğretmenliği Ana Bilim Dalı

    DOÇ. DR. AKIN ÇELİK