Geri Dön

Küçük örneklemlerde çok kategorili puanlanan maddelerden oluşan testlerde klasik test eşitleme yöntemlerinin karşılaştırılması

Comparison of classical test equating methods with polytomously scored tests and small samples

  1. Tez No: 610685
  2. Yazar: ALİ EMRE KARAGÜL
  3. Danışmanlar: DOÇ. DR. ERGÜL DEMİR
  4. Tez Türü: Yüksek Lisans
  5. Konular: Eğitim ve Öğretim, Education and Training
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2020
  8. Dil: Türkçe
  9. Üniversite: Ankara Üniversitesi
  10. Enstitü: Eğitim Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Eğitim Bilimleri Ana Bilim Dalı
  12. Bilim Dalı: Eğitimde Ölçme ve Değerlendirme Bilim Dalı
  13. Sayfa Sayısı: 124

Özet

Bu çalışma, çok kategorili puanlanan maddelerden oluşan testlerin küçük örneklemlere uygulanması durumunda kullanılabilecek test eşitleme yöntemlerini ortaya koymak amacıyla yürütülmüş bir olasılıksal simülasyon çalışmasıdır. Dört KTK temelli test eşitleme yönteminden (ortalamalar ile test eşitleme, Tucker, Braun-Holland ve düşük ağırlıklar doğrusal test eşitleme yöntemleri) elde edilen eşitlemenin standart hatası (ESH), yanlılık ve ortalama hata karekökü (OHKK) değerlerinin örneklem büyüklüğü (15, 20, 30, 60, 100, 150), madde sayısına bağlı puanlama biçimi (3 kategorili 50 madde, 6 kategorili 20 madde ve 11 kategorili 10 madde) ve formlar arası madde eşik parametresi farkı (.1, .4, .7) olmak üzere toplam 54 (6x3x3) koşulun nasıl değişim gösterdiği incelenmiştir. Eşdeğer olmayan gruplar ile bağıntı testi deseni kullanılan simülasyonda veriler, genelleştirilmiş kısmi kredi modeli kullanılarak R yazılımı ltm paketi ile üretilmiştir. Elli dört koşul için toplam 108 test formu üretilmiştir. 100 tekrar uygulanmıştır. Test eşitleme işlemi, equate paketiyle yürütülmüştür. Bootstrap yöntemiyle hata puanları hesaplanmıştır. Bunların ortalamaları alınmış ve aralarındaki farkların test edilmesinde faktöriyel varyans analizi kullanılmıştır. Ayrıca analiz sonuçları grafikler ile yorumlanmıştır. Çalışma, tüm test eşitleme yöntemlerinde, örneklem büyüdükçe ESH, yanlılık ve OHKK değerlerinin düştüğünü göstermektedir. Ayrıca, madde eşik parametresi farkları arttıkça, ESH, yanlılık ve OHKK değerleri artmaktadır. Ancak, madde sayısına bağlı puanlama biçimi koşulu değişimlerinin manidar bir etkisi gözlenmemiştir. Çalışma kapsamında ele alınan tüm koşullarda en düşük ESH, yanlılık ve OHKK değerlerini ortalamalar ile test eşitleme yöntemi, en yüksek değerleriyse düşük ağırlıklar doğrusal test eşitleme yöntemi üretmiştir. Tucker ve Braun-Holland doğrusal test eşitleme yöntemleri birbirlerine çok yakın değerler üretmiş. Aralarındaki fark istatiksel olarak manidar bulunmamıştır.

Özet (Çeviri)

This is a stochastic simulation study and is conducted to compare performances of Mean Equating and Tucker, Braun-Holland and Nominal Weights Linear Test Equating methods when tests are comprised of polytomously scored items and sample sizes are small. Standard error of equating (SEE), bias and root mean square error (RMSE) estimates were comparatively evaluated over 54 conditions using three factors: sample sizes (15, 20, 30, 60, 100, 150), scoring formats (50 items with 3 categories, 20 items with 6 categories and 10 items with 11 categories), and threshold differences between form A and B (.1, .4, .7). The data of the simulation, which is carried on by using non-equivalent groups anchor test design, is generated via R programming language and ltm package program. 108 test forms, two forms for each of 54 conditions, are simulated. The number of replications is 100. Test equating process is carried via equate package program in R programming language. Errors of equating methods are calculated by bootstrapping. The means of these errors are calculated and the difference between them is tested by factorial variance analysis. The results are also summarized using plots. The results reveal that SEE, bias and RMSE values decrease as sample size increases. SEE, bias and RMSE values also increase as the threshold differences increase. No significant differences are observed on SEE, bias and RMSE values due to variations in the scoring formats. The highest SEE, bias and RMSE values are produced by Nominal Weights Linear Equating, whereas the lowest values are produced by Mean Equating in all conditions investigated in the study. Error estimates computed for the Tucker and Braun-Holland Linear Equating methods are similar and small, not amounting to any statistical significance.

Benzer Tezler

  1. Çok kategorili puanlanan maddelerin psikometrik özelliklerinin farklı test koşullarında parametrik olmayan Madde Tepki Kuramı modellerine göre incelenmesi

    Examination of polytomous items' psychometric properties according to nonparametric Item Response Theory models in different test conditions

    ASİYE ŞENGÜL AVŞAR

    Doktora

    Türkçe

    Türkçe

    2015

    Eğitim ve ÖğretimAnkara Üniversitesi

    Ölçme ve Değerlendirme Ana Bilim Dalı

    PROF. DR. EZEL TAVŞANCIL

  2. Karma testlerde iç tutarlılık kestirimlerinin farklı benzetim koşullarında incelenmesi

    Examining of internal inconsistency coefficients for mi̇xed format tests in different simulation conditions

    HATİCE GÜRDİL EGE

    Yüksek Lisans

    Türkçe

    Türkçe

    2018

    Eğitim ve ÖğretimAnkara Üniversitesi

    Ölçme ve Değerlendirme Ana Bilim Dalı

    YRD. DOÇ. DR. ERGÜL DEMİR

  3. Towards a model for analyzing the cognitive gap in user-product interaction throughout the technological evolution

    Kullanıcı-ürün etkileşiminde bilişsel boşluk: Teknolojik evrim açısından bir analiz modeli

    BEYZA DOĞAN

    Doktora

    İngilizce

    İngilizce

    2024

    Endüstri Ürünleri Tasarımıİstanbul Teknik Üniversitesi

    Endüstriyel Tasarım Ana Bilim Dalı

    PROF. DR. HATİCE HÜMANUR BAĞLI

  4. Parametrik ve parametrik olmayan madde tepki kuramı modellerinin farklı örneklemler ve test uzunluğunda karşılaştırılması

    Comparison of parametric and nonparametric item response theory models in various samples and test lenght

    ÖZGE BIKMAZ BİLGEN

    Doktora

    Türkçe

    Türkçe

    2016

    Eğitim ve ÖğretimHacettepe Üniversitesi

    Eğitim Bilimleri Ana Bilim Dalı

    PROF. DR. NURİ DOĞAN

  5. Uç değerlerle baş etmede kullanılan farklı yöntemlerin çeşitli hipotez test sonuçları üzerindeki etkisi

    The effects of different outlier accommodation methods on various hypothesis test results

    BURCU DEMİRÖZ

    Yüksek Lisans

    Türkçe

    Türkçe

    2020

    Eğitim ve ÖğretimBolu Abant İzzet Baysal Üniversitesi

    Eğitim Bilimleri Ana Bilim Dalı

    PROF. DR. ZEKERİYA NARTGÜN