Öğrenci başarısının belirlenmesinde kullanılan farklı ölçme araçlarından elde edilen puanların karşılaştırılması
Comparison of scores obtained from different measurement tools used in the determination of student achievement
- Tez No: 395145
- Danışmanlar: DOÇ. DR. GÜLŞAH BAŞOL
- Tez Türü: Yüksek Lisans
- Konular: Eğitim ve Öğretim, Education and Training
- Anahtar Kelimeler: Genellenebilirlik Kuramı, Klasik Sınav, Başarı, Generalizability Theory, Essay, Success
- Yıl: 2015
- Dil: Türkçe
- Üniversite: Gaziosmanpaşa Üniversitesi
- Enstitü: Eğitim Bilimleri Enstitüsü
- Ana Bilim Dalı: Eğitim Bilimleri Ana Bilim Dalı
- Bilim Dalı: Eğitimde Ölçme ve Değerlendirme Bilim Dalı
- Sayfa Sayısı: 98
Özet
Araştırmanın temel amacı; genellenebilirlik kuramına göre öğrencilerin performanslarının ölçülmesinde kullanılan farklı ölçme araçlarının G ve K çalışmaları sonuçlarını karşılaştırmaktır. Araştırmanın çalışma grubunu, 2013- 2014 öğretim yılı Kars il merkezinde bulunan Atatürk Ortaokulu'nda öğrenim gören sekizinci sınıf öğrencilerinden rastgele seçilmiş 48 öğrenci oluşturmaktadır. Öğrencilere araştırmacı tarafından geliştirilen çoktan seçmeli test ve klasik sınavın uygulandığı araştırmada, ölçme araçlarının puanlanmasında üç puanlayıcı görev almıştır. Klasik sınavı üç farklı puanlayıcı puanlamış ve ölçme sonuçları üzerinde G ve K çalışması yapılmıştır. Elde edilen sonuçlar, uygulanan çoktan seçmeli ve klasik sınav için karışan hata varyanslarının klasik sınavda daha çok olduğunu, puanlama ortalamasına bakıldığında ise çoktan seçmeli teste ait puan değerlerinin daha yüksek olduğunu ve varyans değerlerinin iki sınav için de paralellik gösterdiğini ortaya koymuştur. Araştırmada ayrıca klasik sınav için farklı puanlayıcıların puanları arasındaki fark tespit edilmeye çalışılmıştır. Bunun yanı sıra karar çalışması yapılarak her iki ölçme aracı için bulunan G ve Phi katsayılarındaki farklılıklar incelenmiştir. Buna göre, her iki ölçme aracı için sonuçlar paralellik göstermektedir. Çoktan seçmeli test ve klasik sınav için yapılan karar çalışması sonuçlarına göre madde sayısının arttırılması halinde Phi ve G katsayılarının arttığı; yapılan genellenebilirlik çalışmasına göre her iki sınav türü için de ana varyans kaynağı açısından öncelikli etkinin bireylerden kaynaklandığı görülmüştür. Ayrıca araştırmada farklı puanlayıcılarla tutarlı sonuçlar elde edildiği görülmüştür. Buna göre, soru sayısının arttırılmasındansa puanlayıcı sayısının arttırılmasıyla elde edilen güvenirliğin klasik sınav için daha yüksek olacaktır. Soru sayısını artırılması yazılı sınavların okunmasını güçleştirdiğinden imkanları zorlayarak puanlayıcı sayısının arttırılması önerilmiştir.
Özet (Çeviri)
This is a generalizability study, measuring students' performance through different measurement tools and comparing the finding through G theory and K in order to identify the errors associated with the raters and items to improve the future applications. The sample consisted of 48 randomly selected 8th graders, registered to Atatürk Secondary School, located in the center of Kars province during 2013-2014 academic year. Two different types of exams (a multiple choice test and an essay) prepared by the researcher were applied to students. Three raters graded the students' exams. Essays were scored by three different raters and G and K analyses were performed on the results. According to the findings, the error rate was higher for the essays in comparison to multiple choice test. The mean score was higher for the multiple choice test, on the other hand the variances were found to be similar. For the essays, there were no differences among the scores given by different coders. Decision studies indicated that the findings were in line for both type of the measurements according to G and Phi coefficients. The results indicated that increasing the number of item were resulted in an increase in the G and Phi coefficients. According to the findings, the Person Factor was the main source of the variation in the data for both measurement type. As the findings indicated consistent result among the coders, we suggest to increase the number of coders rather than increasing the number of questions for the essay. Considering the excessive work, associated with grading an essay with more question, when available, it can be better to increase the number of raters.
Benzer Tezler
- Çoktan seçmeli sorulara dayalı olmayan bir kitle matematik sınavı sürecinin değerlendirilmesi: Grup uyumu değerlendirme modeli
Evaluation of a math exam process, which is not based on multiple choice questions: The group moderation evaluation model
MİTHAT TAKUNYACI
Doktora
Türkçe
2016
Eğitim ve ÖğretimMarmara ÜniversitesiOrtaöğretim Fen ve Matematik Öğretmenliği Eğ. Ana Bilim Dalı
DOÇ. DR. EMİN AYDIN
- İletişim becerileri konusunda ebeveynlere verilen eğitimin iletişim çatışmalarına girme eğilimi üzerindeki etkisi
Başlık çevirisi yok
A. ZEYNEP IŞIK
- Öğretmenlerin performanslarının ölçülmesinde kriter olarak kullanılan öğrenci başarısı ve ona etki eden faktörler (Kuleli Askeri Lisesi örneği)
A sutudy on student success as a mean of collecting data in the teachers' performance appraisal process and the factors effecting it'
MEHMET BAHADIR BOZKURT
Yüksek Lisans
Türkçe
2004
Eğitim ve ÖğretimMarmara ÜniversitesiEğitim Bilimleri Ana Bilim Dalı
PROF. DR. HOŞCAN ENSARİ
- Klasik test kuramı genellenebilirlik kuramı ve rasch modeli üzerine bir araştırma
A research on classical test theory generalizaibility theory and rasch model
NEŞE GÜLER
Doktora
Türkçe
2008
Eğitim ve ÖğretimHacettepe ÜniversitesiEğitim Bilimleri Ana Bilim Dalı
DR. SELAHATTİN GELBAL
- Eğitim fakülteleri Almanca öğretmenliği programı için eğitim teknolojisi açısından bir model
Başlık çevirisi yok
GÖNÜL DURUKAFA
Doktora
Türkçe
1994
Eğitim ve ÖğretimDokuz Eylül ÜniversitesiEğitim Bilimleri Ana Bilim Dalı
PROF. DR. GALİP KARAGÖZOĞLU