İki ve çok kategorili puanlanan maddelerde değişen madde fonksiyonlarının karşılaştırılması
A comparison of differential item functioning in two and multi-category scoring items
- Tez No: 432662
- Danışmanlar: YRD. DOÇ. DR. ÖMER KUTLU
- Tez Türü: Doktora
- Konular: Eğitim ve Öğretim, Education and Training
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2016
- Dil: Türkçe
- Üniversite: Ankara Üniversitesi
- Enstitü: Eğitim Bilimleri Enstitüsü
- Ana Bilim Dalı: Ölçme ve Değerlendirme Ana Bilim Dalı
- Bilim Dalı: Ölçme ve Değerlendirme Bilim Dalı
- Sayfa Sayısı: 121
Özet
Bu araştırmanın genel amacı, iki kategorili ve çok kategorili puanlanan maddelerde Değişen Madde Fonksiyonlarının (DMF) karşılaştırılmasıdır. Bu amaç doğrultusunda simülasyon çalışması gerçekleştirilmiş, I. Tip hata ve istatistiksel güç oranları üzerinde çalışılmıştır. 20 madde için hem iki kategorili (1-0) hem çok kategorili (4-3-2-1-0) puanlama yapılmış ve böylelikle iki ayrı veri seti oluşturulmuştur. İki kategorili puanlama için, çok kategorili puanlamada beşinci adım olan 4'e 1 puan verilmiş, 3-2-1-0'a ise 0 puan verilmiştir. Simülasyon kapsamında örneklem büyüklüğü (600, 1200, 2400), örneklem büyüklüğü oranı (1:1, 1:2), DMF içeren madde yüzdesi (%10, %30, %50) ve DMF büyüklüğü (0.25, 0.50, 1.00, 1.50) manipüle edilen koşullar olarak ele alınırken, DMF biçimi (Tek Biçimli DMF) ve toplam madde sayısı (20) sabit koşullar olarak ele alınmıştır. Böylelikle 72 koşul kapsamında gerçekleştirilen araştırma için 100 tekrar gerçekleştirilmiştir. Verilerin türetilmesinde, iki kategorili veriler için Rasch, çok kategorili veriler için ise Kısmi Puan Modeli kullanılmıştır. WinGen programında madde parametreleri hesaplanmış, R programında“eRm”paketi yardımıyla veriler türetilmiştir. İki kategorili veriler için Mantel-Haenszel ve LORDIF; çok kategorili veriler için ise LORDIF ve ANOVA DMF belirleme analizleri kullanılmıştır. Araştırmanın temel amacı olan iki kategorili ve çok kategorili puanlama modelleri kapsamında DMF karşılaştırıldığında, genel olarak çok kategorili puanlama yapılması durumunda I. Tip hata oranlarının daha düşük, istatistiksel güç oranlarının ise daha yüksek olduğu belirlenmiştir. Bu doğrultuda DMF sonuçlarında puanlama modellerinin etkisi olduğu ve kısmi puan dikkate alındığında DMF sonuçlarının değişebileceği ortaya konulmuştur. Elde edilen bulgular doğrultusunda genel olarak örneklem büyüklüğü 600'den 2400'e doğru arttıkça I. Tip hata oranlarının arttığı ancak I. Tip hata oranlarında, örneklem büyüklüğüne göre manidar bir farklılık olmadığı (p>.05) belirtilmiştir. Örneklem büyüklüğü 600'den 2400'e doğru arttıkça, istatistiksel güç oranlarının da arttığı ve örneklem büyüklüğüne göre ANOVA DMF belirleme analizi hariç manidar bir farklılık olmadığı (p>.05) ve ANOVA DMF için ise 600 ve 2400 örneklem büyüklükleri için manidar fark olduğu (p.05) belirlenmiş, 1:1 örneklem büyüklüğü oranında hem I. Tip hata hem de istatistiksel güç oranlarının daha yüksek olduğu saptanmıştır. DMF'li madde oranı %10'dan %50'ye doğru arttıkça I. Tip hata oranlarının arttığı ve istatistiksel güç oranlarının azaldığı ve I. Tip hata ve istatistiksel güç oranlarının, DMF'li madde oranlarına göre manidar bir farklılık gösterdiği (p
Özet (Çeviri)
The aim of this study is to compare Differential Item Functioning for two-category scored and multi-category scored items. For this purpose, simulation studies were performed; Type I error and statistical power ratios were studied. For 20 items, both two category (1-0) and multi category (4-3-2-1-0) scoring was done and thus two data sets were created. Two category scoring was done by scoring 4, which was the fifth step of multi category scoring as 1 and scoring the other steps 3-2-1-0 as 0. Whereas sample size (600, 1200, 2400), sample size ratio (1:1, 1:2), percentage of items containing DIF (%10, %30, %50), and DIF magnitude (0.25, 0.50, 1.00, 1.50) were taken as manipulated conditions; DIF format (Uniform DIF) and total item number (20) were considered as stable conditions as part of simulation process. Hereby 100 replication were carried out for research conducted under 72 conditions. In the process of data derivation, Rasch was used for two-category data, Partial Credit Model was used for multiple-category data. Item parameters were calculated with WinGen program and data was derived with“eRm”package of R program. Mantel-Haenszel and LORDIF analysis were used for two category data; LORDIF and ANOVA DIF analysis were used for multiple category data. When DIF was compared within the scope of two category and multiple category scoring models which is the main purpose of this study, it was seen that when multiple category scoring was done, ratio of Type I error was lower but statistical power ratio was higher. In this context it was observed that scoring models effect DIF results and DIF results may vary considering partial credit scores. According to the findings, when sample size was increased from 600 to 2400, Type I error ratio increased, but Type I error was not significantly different based on sample size (p>.05). It was determined that when sample size was increased from 600 to 2400, statistical power rates were also increased, but statistical power ratio was not significantly different based on sample size (p>.05) except ANOVA DIF analyses. For ANOVA DIF analyses, there was a significant difference (p.05) in Type I error and statistical power ratio based on sample size ratio. It was also seen that the ratio of Type I error and statistical power was higher in 1:1 sample size ratio. When DIF item rates were increased from 10% to 50%, Type I error ratio was increased and statistical power ratio was decreased, and Type I error and statistical power ratio were significantly different compared with DIF item ratio (p
Benzer Tezler
- Karma testlerde kayıp verilerin değişen madde fonksiyonunaetkisinin incelenmesi
Investigation of the effect of missing data on differantial item functioning in mixed type tests
LEYLA BURCU DİNÇSOY
Yüksek Lisans
Türkçe
2022
Eğitim ve ÖğretimHacettepe ÜniversitesiEğitim Bilimleri Ana Bilim Dalı
PROF. DR. HÜLYA KELECİOĞLU
- İkili puanlanan testlerde yerel madde bağımsızlık varsayımının ihlâlinin test eşitleme yöntemlerine etkisi
The effect of violations of the local item independence assumption on test equating methods in binary scored tests
MEHMET FATİH DOĞUYURT
Doktora
Türkçe
2023
Eğitim ve ÖğretimGazi ÜniversitesiEğitim Bilimleri Ana Bilim Dalı
PROF. DR. ŞEREF TAN
- İş kazaları ile stres, kaygı ve öfke kavramları arasındaki ilişkinin incelenmesi: 9 Türk ve 2 İngiliz tekstil fabrikasında yapılan bir araştırma
The relations between work accidents and stress, anxiety and anger: A survey at 9 Turkish and 2 English textile factories
M. HÜLYA ÜNAL KARAGÜVEN
Doktora
Türkçe
1997
Çalışma Ekonomisi ve Endüstri İlişkileriİstanbul Üniversitesiİşletme Ana Bilim Dalı
PROF. DR. AYŞE CAN BAYSAL
- ICD-11 kişilik bozukluğu tanı ölçütlerine yönelik klinisyen değerlendirmeleri ile özbildirim ölçeğinin geçerlik ve güvenirliği
The validity and reliability of clinicians' ratings and self-report scale scores in evaluating ICD-11 (international classification of diseases - 11TH edition) diagnostic criteria for general personality disorder
TUĞBA AYDIN SEYREK
Tıpta Uzmanlık
Türkçe
2022
PsikiyatriAdnan Menderes ÜniversitesiRuh Sağlığı ve Hastalıkları Ana Bilim Dalı
PROF. DR. İBRAHİM FERHAN DEREBOY
- İlköğretim okullarında bazı durumların örgütsel çatışma yaratma derecelerine ilişkin yönetici ve öğretmen görüşleri
Başlık çevirisi yok
SONER POLAT
Yüksek Lisans
Türkçe
2000
Eğitim ve Öğretimİnönü ÜniversitesiEğitim Bilimleri Ana Bilim Dalı
DOÇ. DR. MUALLA AKSU