Klasik Test Kuramına ve Madde Tepki Kuramına dayalı test eşitleme yöntemlerinin karşılaştırması: Uluslararası Öğrenci Değerlendirme Programı (PISA) 2012 matematik testi örneği
Comparison of test equating methods based on Classical Test Theory and Item Response Theory: International Student Assessment Program (PISA) 2012 mathematics test case
- Tez No: 658052
- Danışmanlar: PROF. DR. MEHTAP ÇAKAN
- Tez Türü: Doktora
- Konular: Eğitim ve Öğretim, Education and Training
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2021
- Dil: Türkçe
- Üniversite: Gazi Üniversitesi
- Enstitü: Eğitim Bilimleri Enstitüsü
- Ana Bilim Dalı: Eğitim Bilimleri Ana Bilim Dalı
- Bilim Dalı: Eğitimde Ölçme ve Değerlendirme Bilim Dalı
- Sayfa Sayısı: 236
Özet
Bu araştırmada Klasik Test Kuramı'ndaki ve Madde Tepki Kuramı'ndaki eşitleme yöntemleri kullanılarak en az eşitleme hata ile en uygun eşitleme yönteminin belirlenmesi amaçlanmıştır. Çalışmanın verileri için PISA 2012 Matematik testi, kitapçık 1 ve kitapçık3 puanları eşitlenmede kullanılmıştır. Araştırmaya Türkiye, Endonezya, Şangay/Çin ve Finlandiya verileri seçilmiştir. Araştırmada Klasik Test Kuramı doğrusal eşitleme için Tucker (w1=1, w1=0,5), Levine gözlenen puan (w1=1, w1=0,5), Levine gerçek puan, klasik konjenerik ve Braun-Holland kullanılmıştır. Belirtilen bu yöntemlerden Tucker eşitlemenin en az hata ile eşitleme yaptığı, Levine gerçek puan eşitleme yönteminin ise en fazla hata ile eşitleme yaptığı bulunmuştur. Klasik Test Kuramında yer alan eşit yüzdelikli eşitleme yöntemlerinden önce düzgünleştirme yapılmıştır. Ön düzgünleştirmede C 6 polinom derecesi ve beta4 binomial fonksiyonu, son düzgünleştirme için ise kübik spline S 0,05 derecesi analitik ve grafiksel süreç sonunda en uygun düzgünleştirme olarak seçilmiştir. Hata bant değeri içerisindeki dağılımları ve hata miktarlarına göre kendi aralarında kıyaslandığında beta4 binomial fonksiyonun en iyi, C 6 polinom derecesinin ise en fazla hataya sahip olarak düzgünleştirme yöntemi olduğu bulunmuştur. Eşit yüzdelikli eşitleme sürecinde frekans kestirim (w1=1, w1=0,5) eşit yüzdelikli eşitleme yöntemi kullanılmıştır. Eşit yüzdelikli eşitleme için en az hata w1=0,5 frekans kestirim yönteminden, en fazla hata w1=1 frekans kestirim eşitleme yönteminden elde edilmiştir. Klasik Test Kuramına ilişkin doğrusal ve eşit yüzdelikli eşitleme yöntemleri kıyaslandığında eşit yüzdelikli eşitlemede daha az hata ile eşitlenmiş puanların elde edildiği görülmüştür. Madde Tepki Kuramına dayalı eşitleme sürecine kalibrasyon yaparak başlanmıştır. Madde karakteristik eğri kalibrasyon yöntemlerinden Stocking-Lord yönteminin daha iyi sonuç sağladığı görülmüştür. Madde Tepki Kuramı gözlenen ve gerçek puan eşitleme yöntemlerinden elde edilen eşitlenmiş puanlar karşılaştırıldığında Madde Tepki Kuramı gerçek puan eşitleme, daha az hata barındırdığı sonucuna ulaşılmıştır. Kuramlardaki eşitleme yöntemleri kıyaslandığında Madde Tepki Kuramı yöntemlerinin daha az hata ile eşitleme yaptığı bulunmuştur. Yapılacak eşitleme çalışmalarında Madde Tepki Kuramı gerçek puana dayalı eşitleme yapılması önerilmiştir.
Özet (Çeviri)
In this study, it was aimed to determine the most appropriate equating method with the least equating error by using the equating methods in Classical Test Theory and Item Response Theory. The scores of the booklet 1 and the booklet 3 in the PISA 2012 Mathematics test were used to be equated for the data of the research. The data of Turkey, Indonesia, Shanghai / China and Finland were selected for the research. In the study, Tucker (w1 = 1, w1 = 0.5), Levine observed score (w1 = 1, w1 = 0.5), Levine true score, classical congeneric and Braun-Holland methods were used. Among these methods, Tucker equalization was found to equate with the fewer error, and Levine true score equating method equated with the highest error. The smoothing procedure was completed before the equipercentile equating methods in the Classical Test Theory. The C 6 polynomial degree and beta4 binomial function in the pre-smoothing, and the cubic spline S 0,05 degree for the final smoothing were selected as the most appropriate smoothing at the end of the analytical and graphical process. When compared to each other according to their distribution within the error band value and the amount of error, it was found that the beta4 binomial function was the best smoothing method, while the C 6 polynomial degree had the highest error. Frequency estimation (w1 = 1, w1 = 0.5) equating method were used in the equipercentile equating process. For equipercentile equating, the least error was obtained from the w1=0,5 frequency estimation method, and the highest error was obtained from the w1=1 frequency estimation equipercentile equating method. When the linear and equipercentile equating. Methods related to Classical Test Theory were compared, it was seen that scores equated with less errors were obtained in equipercentile equating. The equating process based on Item Response Theory started with making calibration. It was seen that the Stocking-Lord method provided better results among item characteristic curve calibration methods. When the equated scores obtained from the Item Response Theory observed and real point equating methods were compared, it was concluded that the Item Response Theory actual score equating contained less errors. When the equating methods in the theories were compared, it was found that the Item Response Theory methods made equalization with less error. It is recommended to make equating based on Item Response Theory true score in equating studies.
Benzer Tezler
- Açık uçlu maddelerde otomatik puanlamanın güvenirliği ve test eşitleme hatalarına etkisi
The reliability of automated essay scoring and its effect on test equating errors
İBRAHİM UYSAL
Doktora
Türkçe
2019
Eğitim ve ÖğretimHacettepe ÜniversitesiEğitim Bilimleri Ana Bilim Dalı
PROF. DR. NURİ DOĞAN
- Çok kategorili puanlanan maddelerden oluşan testlerde klasik test kuramı ve Madde Tepki Kuramı'na dayalı test eşitleme yöntemlerinin karşılaştırılması
Comparison of test equating methods based on classical test theory and Item Response Theory in polytomously scored tests
MERVE ÇÖRTÜK
Yüksek Lisans
Türkçe
2022
Eğitim ve ÖğretimAkdeniz ÜniversitesiEğitim Bilimleri Ana Bilim Dalı
DOÇ. DR. ALPER SİNAN
- Bir başarı testinin madde ayırt edicilik parametresi ve güvenirliğinin iki kuram altında karşılaştırılması
Comparison of item discrimination parameter and reliability of an achievement test according to two theories
AYSU KORKMAZ
Yüksek Lisans
Türkçe
2024
Eğitim ve ÖğretimBolu Abant İzzet Baysal ÜniversitesiEğitim Bilimleri Ana Bilim Dalı
PROF. DR. İBRAHİM ALPER KÖSE
- Dikey ölçeklemede klasik test ve madde tepki kuramına dayalı yöntemlerin karşılaştırılması
Comparison of the methods of classical test theory and item response theory in vertical scaling
EMRE ÇETİN
Doktora
Türkçe
2009
Eğitim ve ÖğretimHacettepe ÜniversitesiEğitim Bilimleri Bölümü
DOÇ. SELAHATTİN GELBAL
- Kısa yanıtlı maddelerde farklı ağırlıklı puanlanma yöntemlerinin testin psikometrik özellikleri açısından incelenmesi
Investigation of different weighted scoring methods in short-answered items in terms of psychometric properties of the test
EMEL ILICAN
Doktora
Türkçe
2024
Eğitim ve ÖğretimAnkara ÜniversitesiEğitim Bilimleri Ana Bilim Dalı
PROF. DR. KAAN ZÜLFİKAR DENİZ