Küçük örneklemlerde çok kategorili puanlanan maddelerden oluşan testlerde klasik test eşitleme yöntemlerinin karşılaştırılması

Comparison of classical test equating methods with polytomously scored tests and small samples

PDF İndir

Tez No: 610685
Yazar: ALİ EMRE KARAGÜL
Danışmanlar: DOÇ. DR. ERGÜL DEMİR
Tez Türü: Yüksek Lisans
Konular: Eğitim ve Öğretim, Education and Training
Anahtar Kelimeler: Belirtilmemiş.
Yıl: 2020
Dil: Türkçe
Üniversite: Ankara Üniversitesi
Enstitü: Eğitim Bilimleri Enstitüsü
Ana Bilim Dalı: Eğitim Bilimleri Ana Bilim Dalı
Bilim Dalı: Eğitimde Ölçme ve Değerlendirme Bilim Dalı
Sayfa Sayısı: 124

Özet

Bu çalışma, çok kategorili puanlanan maddelerden oluşan testlerin küçük örneklemlere uygulanması durumunda kullanılabilecek test eşitleme yöntemlerini ortaya koymak amacıyla yürütülmüş bir olasılıksal simülasyon çalışmasıdır. Dört KTK temelli test eşitleme yönteminden (ortalamalar ile test eşitleme, Tucker, Braun-Holland ve düşük ağırlıklar doğrusal test eşitleme yöntemleri) elde edilen eşitlemenin standart hatası (ESH), yanlılık ve ortalama hata karekökü (OHKK) değerlerinin örneklem büyüklüğü (15, 20, 30, 60, 100, 150), madde sayısına bağlı puanlama biçimi (3 kategorili 50 madde, 6 kategorili 20 madde ve 11 kategorili 10 madde) ve formlar arası madde eşik parametresi farkı (.1, .4, .7) olmak üzere toplam 54 (6x3x3) koşulun nasıl değişim gösterdiği incelenmiştir. Eşdeğer olmayan gruplar ile bağıntı testi deseni kullanılan simülasyonda veriler, genelleştirilmiş kısmi kredi modeli kullanılarak R yazılımı ltm paketi ile üretilmiştir. Elli dört koşul için toplam 108 test formu üretilmiştir. 100 tekrar uygulanmıştır. Test eşitleme işlemi, equate paketiyle yürütülmüştür. Bootstrap yöntemiyle hata puanları hesaplanmıştır. Bunların ortalamaları alınmış ve aralarındaki farkların test edilmesinde faktöriyel varyans analizi kullanılmıştır. Ayrıca analiz sonuçları grafikler ile yorumlanmıştır. Çalışma, tüm test eşitleme yöntemlerinde, örneklem büyüdükçe ESH, yanlılık ve OHKK değerlerinin düştüğünü göstermektedir. Ayrıca, madde eşik parametresi farkları arttıkça, ESH, yanlılık ve OHKK değerleri artmaktadır. Ancak, madde sayısına bağlı puanlama biçimi koşulu değişimlerinin manidar bir etkisi gözlenmemiştir. Çalışma kapsamında ele alınan tüm koşullarda en düşük ESH, yanlılık ve OHKK değerlerini ortalamalar ile test eşitleme yöntemi, en yüksek değerleriyse düşük ağırlıklar doğrusal test eşitleme yöntemi üretmiştir. Tucker ve Braun-Holland doğrusal test eşitleme yöntemleri birbirlerine çok yakın değerler üretmiş. Aralarındaki fark istatiksel olarak manidar bulunmamıştır.

Özet (Çeviri)

This is a stochastic simulation study and is conducted to compare performances of Mean Equating and Tucker, Braun-Holland and Nominal Weights Linear Test Equating methods when tests are comprised of polytomously scored items and sample sizes are small. Standard error of equating (SEE), bias and root mean square error (RMSE) estimates were comparatively evaluated over 54 conditions using three factors: sample sizes (15, 20, 30, 60, 100, 150), scoring formats (50 items with 3 categories, 20 items with 6 categories and 10 items with 11 categories), and threshold differences between form A and B (.1, .4, .7). The data of the simulation, which is carried on by using non-equivalent groups anchor test design, is generated via R programming language and ltm package program. 108 test forms, two forms for each of 54 conditions, are simulated. The number of replications is 100. Test equating process is carried via equate package program in R programming language. Errors of equating methods are calculated by bootstrapping. The means of these errors are calculated and the difference between them is tested by factorial variance analysis. The results are also summarized using plots. The results reveal that SEE, bias and RMSE values decrease as sample size increases. SEE, bias and RMSE values also increase as the threshold differences increase. No significant differences are observed on SEE, bias and RMSE values due to variations in the scoring formats. The highest SEE, bias and RMSE values are produced by Nominal Weights Linear Equating, whereas the lowest values are produced by Mean Equating in all conditions investigated in the study. Error estimates computed for the Tucker and Braun-Holland Linear Equating methods are similar and small, not amounting to any statistical significance.

Benzer Tezler

Tez No
419286
Çok kategorili puanlanan maddelerin psikometrik özelliklerinin farklı test koşullarında parametrik olmayan Madde Tepki Kuramı modellerine göre incelenmesi
Examination of polytomous items' psychometric properties according to nonparametric Item Response Theory models in different test conditions
ASİYE ŞENGÜL AVŞAR
Doktora
Türkçe
2015
Eğitim ve Öğretim Ankara Üniversitesi
Ölçme ve Değerlendirme Ana Bilim Dalı
PROF. DR. EZEL TAVŞANCIL
Tez No
494189
Karma testlerde iç tutarlılık kestirimlerinin farklı benzetim koşullarında incelenmesi
Examining of internal inconsistency coefficients for mi̇xed format tests in different simulation conditions
HATİCE GÜRDİL EGE
Yüksek Lisans
Türkçe
2018
Eğitim ve Öğretim Ankara Üniversitesi
Ölçme ve Değerlendirme Ana Bilim Dalı
YRD. DOÇ. DR. ERGÜL DEMİR
Tez No
876713
Towards a model for analyzing the cognitive gap in user-product interaction throughout the technological evolution
Kullanıcı-ürün etkileşiminde bilişsel boşluk: Teknolojik evrim açısından bir analiz modeli
BEYZA DOĞAN
Doktora
İngilizce
2024
Endüstri Ürünleri Tasarımı İstanbul Teknik Üniversitesi
Endüstriyel Tasarım Ana Bilim Dalı
PROF. DR. HATİCE HÜMANUR BAĞLI
Tez No
457672
Parametrik ve parametrik olmayan madde tepki kuramı modellerinin farklı örneklemler ve test uzunluğunda karşılaştırılması
Comparison of parametric and nonparametric item response theory models in various samples and test lenght
ÖZGE BIKMAZ BİLGEN
Doktora
Türkçe
2016
Eğitim ve Öğretim Hacettepe Üniversitesi
Eğitim Bilimleri Ana Bilim Dalı
PROF. DR. NURİ DOĞAN
Tez No
638799
Uç değerlerle baş etmede kullanılan farklı yöntemlerin çeşitli hipotez test sonuçları üzerindeki etkisi
The effects of different outlier accommodation methods on various hypothesis test results
BURCU DEMİRÖZ
Yüksek Lisans
Türkçe
2020
Eğitim ve Öğretim Bolu Abant İzzet Baysal Üniversitesi
Eğitim Bilimleri Ana Bilim Dalı
PROF. DR. ZEKERİYA NARTGÜN

Geri Dön