Dikey ölçeklemede klasik test ve madde tepki kuramına dayalı yöntemlerin karşılaştırılması
Comparison of the methods of classical test theory and item response theory in vertical scaling
- Tez No: 257650
- Danışmanlar: DOÇ. SELAHATTİN GELBAL
- Tez Türü: Doktora
- Konular: Eğitim ve Öğretim, Education and Training
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2009
- Dil: Türkçe
- Üniversite: Hacettepe Üniversitesi
- Enstitü: Sosyal Bilimler Enstitüsü
- Ana Bilim Dalı: Eğitim Bilimleri Bölümü
- Bilim Dalı: Eğitim Bilimleri Ana Bilim Dalı
- Sayfa Sayısı: 109
Özet
Dikey ölçekleme, öğrencilerin, ardışık sınıf ya da yaş seviyelerinde matematik ya da dilbilgisi gibi alanlarda, ne kadar gelişim ortaya koyduğunu belirlemeye yarayan bir bağlama türüdür. Bu araştırmanın amacı, dikey ölçekleme işlemi sonucunda, sınıf seviyesi arttıkça, bu seviyelerde meydana gelen büyümenin örüntüsünü çıkarmak ve bu örüntünün örneklem büyüklüğünden nasıl etkilendiğini belirlemektir.Araştırmanın verilerini, 2005 yılında Türkiye genelinde yapılan İlköğretim Öğrencilerinin Başarılarının Belirlenmesi Sınavı (ÖBBS)'na ait 6., 7. ve 8. sınıf öğrencileri oluşturmaktadır. Araştırma 6. sınıfta 13401, 7. sınıfta 5368 ve 8. sınıfta da 11200 öğrenci üzerinden yürütülmüştür.Dikey ölçekleme, Klasik Test Teorisi (KTT) ve Madde Yanıt Kuramı (MTK) temelinde uygulanmıştır. Klasik Test Teorisine dayalı olarak Thurstone (1938), Madde yanıt Kuramına dayalı olarak yapılan yetenek kestirimlerinde de Expected A Posteriori (EAP) puanlama yolu kullanılmıştır. MTK seçiminde model veri uyumu sonucunda 2 parametreli modelin madde yetenek kestirimi için daha uygun olduğu ortaya çıkmıştır.Dikey Ölçeklemenin değerlendirme ölçütü olarak; örneklem büyüklüğünde farklı örneklemlere ait ilgilenilen istatistiğin standart sapmaları, akademik gelişim için ise ortalama, standart sapma ve etki büyüklüğü değerleri kullanılmıştır.Örneklem büyüklüğünün etkisini belirlemek amacıyla, ilk olarak tüm örneklem üzerinden Thurstone Ölçekleme işlemi yürütülmüş, daha sonra da tüm örneklemden 250, 500 ve 1000'er kişilik 100'er örneklem yerine koyma (bootstrap) yöntemiyle seçilmiştir. Her örneklem büyüklüğü için ortalama ve standart sapma değerleri örnekleme hatası olarak değerlendirilmiştir.Araştırma sonunda, KTT'ya dayalı Thurstone ölçeklemede ortalama örüntüsünden bağımsız olarak matematik ve Türkçe testlerinde sınıf seviyesi ile birlikte standart sapmalar artış göstermektedir.MTK'ya dayalı ölçekleme sonunda, matematik dersinde, sınıf seviyesi ile ortalamalar tutarlı bir artma ya da azalma göstermez iken, standart sapmalar sınıf seviyelerine bağlı olarak artış göstermiştir. Fakat Türkçe testine ait, MTK ölçeklemesinde gerek ortalama gerekse standart sapmalarda düzenli bir örüntü meydana gelmemiştir.Örneklem büyüklükleri, Thurstone yöntemiyle incelendiğinde, 1000 kişilik örneklemin, hatayı minimize ettiği ve örneklem küçüldükçe (250), örnekleme hatasının arttığı görülmektedir.Bulgular ve yorumlar sonucunda, akademik gelişimin ölçeklenmesi için kullanılan ölçütler incelendiğinde, standart sapmaların tutarlı bir şekilde arttığı gözlenmektedir. Gerek KTK gerekse MTK uygulamalarında, ortalamaların seyrinden farklı olarak standart sapmaların arttığı söylenebilir. Thurstone ölçeklemede en az 1000 kişilik bir örneklem grubu kullanılması önerilmektedir.
Özet (Çeviri)
Vertical Scaling is a kind of linking which is used to determine how much the students of adjacent grades or ages have improved in the subject areas such as Maths and Language. The purpose of this research is, as a result of vertical scaling, to establish the pattern of students? improvement in certain levels as class grade increases and to find out how this pattern is affected by the amount of the sample size.The data in this research were obtained from the Achievement Exam (OBBS) results for Turkish primary school students of the 6th, 7th and 8th grades in 2005. The research was conducted among 13401 students from the 6th grade, 5368 from the 7th and 11200 from the 8th.Vertical Scaling was conducted based on Classic Test Theory (CTT) and Item Response Theory (IRT). Thurstone (1938) scaling method was used based on CTT, and Expected A Posteriori (EAP) scaling method was used in IRT estimation. When IRT was chosen, as a result of model-data fit, the two-parameter model was found to fit the data better than other models.As evaluation criteria of vertical scaling, standard deviations of related statistics obtained from different samplings were used in sampling size ; and mean standard deviation and effect size figures in academic growth were used.To determine the effect of sampling size; firstly, Thurstone scaling method was conducted for the whole sampling, and later from this sampling 100 samplings of 250, 500 and 1000 persons were chosen by means of bootstrap method. For every sampling size, mean and standard deviations were considered as error of sampling.At the end of the research, free from its mean pattern in Thurstone Scaling based on CTT, standard deviations in Maths and Turkish Tests rise as class levels increase.At the end of the scaling based on IRT, whereas class levels and means in maths do not increase or decrease consistently, standard deviations increase related to certain levels. However, in IRT scaling of the Turkish Test, a consistent pattern is obtained neither in means nor in standard deviations.When sampling sizes are analyzed by means of Thurstone method, it is found that the sampling of 1000 persons minimizes the error, and that as sampling size gets smaller (250), sampling error increases.According to the results and conclusions, when criteria to observe growth are studied, it is found that as class levels increase, so do standard deviations consistently. In the conducts of CTT and IRT, it can be said that standard deviations increase free from the increase or decrease of means. It is suggested that in Thurstone Scaling a sampling of at least 1000 persons be used.
Benzer Tezler
- A model based flight control system design approach for micro aerial vehicles using integrated flight testing and hil simulations
Küçük boyutlu insansız hava araçları üzerinde sistem tanılama, uçuş kontrol sistem tasarımı ve donanım ile benzetim uygulamaları
BURAK YÜKSEK
Doktora
İngilizce
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiMekatronik Mühendisliği Ana Bilim Dalı
PROF. DR. GÖKHAN İNALHAN
- Effects on the transportation of pollen grains and inorganic particles in sedimentological processes
Sedimentolojik süreçlerin polen tanelerinin ve inorganik parçacıkların taşınması üzerindeki etkileri
DURSUN ACAR
Yüksek Lisans
İngilizce
2024
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesiİklim ve Deniz Bilimleri Ana Bilim Dalı
DOÇ. DR. DEMET BİLTEKİN
PROF. DR. ÖZCAN KALENDERLİ
- Dikey ölçeklemede madde tepki kuramına dayalı farklı kalibrasyon ve yetenek kestirim yöntemlerinin karşılaştırılması
A comparison of different calibration methods and proficiency estimators based on item response theory in vertical scaling
AYŞEGÜL ALTUN
Doktora
Türkçe
2013
Eğitim ve ÖğretimHacettepe ÜniversitesiEğitim Bilimleri Bölümü
DOÇ. DR. HÜLYA KELECİOĞLU
- Fen başarısındaki artışın belirlenmesinde madde tepki kuramına dayalı dikey ölçekleme yöntemlerinin karşılaştırılması
A comparison of irt vertical scaling methods in determining of the increase in achievement of science education
AYLİN ALBAYRAK SARI
Doktora
Türkçe
2014
Eğitim ve ÖğretimHacettepe ÜniversitesiEğitim Bilimleri Ana Bilim Dalı
PROF. DR. HÜLYA KELECİOĞLU
- Time series analysis for dynamic resource provisioning in cloud platforms
Bulut tabanlı ortamlarda dinamik kaynak sağlama için zaman serisi analizi
FATİH KÜÇÜKKARA
Yüksek Lisans
İngilizce
2018
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBahçeşehir ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. TEVFİK AYTEKİN