Geri Dön

Öğrenci başarısının belirlenmesinde kullanılan farklı ölçme araçlarından elde edilen puanların karşılaştırılması

Comparison of scores obtained from different measurement tools used in the determination of student achievement

  1. Tez No: 395145
  2. Yazar: MUAMMER YÜKSEL
  3. Danışmanlar: DOÇ. DR. GÜLŞAH BAŞOL
  4. Tez Türü: Yüksek Lisans
  5. Konular: Eğitim ve Öğretim, Education and Training
  6. Anahtar Kelimeler: Genellenebilirlik Kuramı, Klasik Sınav, Başarı, Generalizability Theory, Essay, Success
  7. Yıl: 2015
  8. Dil: Türkçe
  9. Üniversite: Gaziosmanpaşa Üniversitesi
  10. Enstitü: Eğitim Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Eğitim Bilimleri Ana Bilim Dalı
  12. Bilim Dalı: Eğitimde Ölçme ve Değerlendirme Bilim Dalı
  13. Sayfa Sayısı: 98

Özet

Araştırmanın temel amacı; genellenebilirlik kuramına göre öğrencilerin performanslarının ölçülmesinde kullanılan farklı ölçme araçlarının G ve K çalışmaları sonuçlarını karşılaştırmaktır. Araştırmanın çalışma grubunu, 2013- 2014 öğretim yılı Kars il merkezinde bulunan Atatürk Ortaokulu'nda öğrenim gören sekizinci sınıf öğrencilerinden rastgele seçilmiş 48 öğrenci oluşturmaktadır. Öğrencilere araştırmacı tarafından geliştirilen çoktan seçmeli test ve klasik sınavın uygulandığı araştırmada, ölçme araçlarının puanlanmasında üç puanlayıcı görev almıştır. Klasik sınavı üç farklı puanlayıcı puanlamış ve ölçme sonuçları üzerinde G ve K çalışması yapılmıştır. Elde edilen sonuçlar, uygulanan çoktan seçmeli ve klasik sınav için karışan hata varyanslarının klasik sınavda daha çok olduğunu, puanlama ortalamasına bakıldığında ise çoktan seçmeli teste ait puan değerlerinin daha yüksek olduğunu ve varyans değerlerinin iki sınav için de paralellik gösterdiğini ortaya koymuştur. Araştırmada ayrıca klasik sınav için farklı puanlayıcıların puanları arasındaki fark tespit edilmeye çalışılmıştır. Bunun yanı sıra karar çalışması yapılarak her iki ölçme aracı için bulunan G ve Phi katsayılarındaki farklılıklar incelenmiştir. Buna göre, her iki ölçme aracı için sonuçlar paralellik göstermektedir. Çoktan seçmeli test ve klasik sınav için yapılan karar çalışması sonuçlarına göre madde sayısının arttırılması halinde Phi ve G katsayılarının arttığı; yapılan genellenebilirlik çalışmasına göre her iki sınav türü için de ana varyans kaynağı açısından öncelikli etkinin bireylerden kaynaklandığı görülmüştür. Ayrıca araştırmada farklı puanlayıcılarla tutarlı sonuçlar elde edildiği görülmüştür. Buna göre, soru sayısının arttırılmasındansa puanlayıcı sayısının arttırılmasıyla elde edilen güvenirliğin klasik sınav için daha yüksek olacaktır. Soru sayısını artırılması yazılı sınavların okunmasını güçleştirdiğinden imkanları zorlayarak puanlayıcı sayısının arttırılması önerilmiştir.

Özet (Çeviri)

This is a generalizability study, measuring students' performance through different measurement tools and comparing the finding through G theory and K in order to identify the errors associated with the raters and items to improve the future applications. The sample consisted of 48 randomly selected 8th graders, registered to Atatürk Secondary School, located in the center of Kars province during 2013-2014 academic year. Two different types of exams (a multiple choice test and an essay) prepared by the researcher were applied to students. Three raters graded the students' exams. Essays were scored by three different raters and G and K analyses were performed on the results. According to the findings, the error rate was higher for the essays in comparison to multiple choice test. The mean score was higher for the multiple choice test, on the other hand the variances were found to be similar. For the essays, there were no differences among the scores given by different coders. Decision studies indicated that the findings were in line for both type of the measurements according to G and Phi coefficients. The results indicated that increasing the number of item were resulted in an increase in the G and Phi coefficients. According to the findings, the Person Factor was the main source of the variation in the data for both measurement type. As the findings indicated consistent result among the coders, we suggest to increase the number of coders rather than increasing the number of questions for the essay. Considering the excessive work, associated with grading an essay with more question, when available, it can be better to increase the number of raters.

Benzer Tezler

  1. Çoktan seçmeli sorulara dayalı olmayan bir kitle matematik sınavı sürecinin değerlendirilmesi: Grup uyumu değerlendirme modeli

    Evaluation of a math exam process, which is not based on multiple choice questions: The group moderation evaluation model

    MİTHAT TAKUNYACI

    Doktora

    Türkçe

    Türkçe

    2016

    Eğitim ve ÖğretimMarmara Üniversitesi

    Ortaöğretim Fen ve Matematik Öğretmenliği Eğ. Ana Bilim Dalı

    DOÇ. DR. EMİN AYDIN

  2. Öğretmenlerin performanslarının ölçülmesinde kriter olarak kullanılan öğrenci başarısı ve ona etki eden faktörler (Kuleli Askeri Lisesi örneği)

    A sutudy on student success as a mean of collecting data in the teachers' performance appraisal process and the factors effecting it'

    MEHMET BAHADIR BOZKURT

    Yüksek Lisans

    Türkçe

    Türkçe

    2004

    Eğitim ve ÖğretimMarmara Üniversitesi

    Eğitim Bilimleri Ana Bilim Dalı

    PROF. DR. HOŞCAN ENSARİ

  3. Klasik test kuramı genellenebilirlik kuramı ve rasch modeli üzerine bir araştırma

    A research on classical test theory generalizaibility theory and rasch model

    NEŞE GÜLER

    Doktora

    Türkçe

    Türkçe

    2008

    Eğitim ve ÖğretimHacettepe Üniversitesi

    Eğitim Bilimleri Ana Bilim Dalı

    DR. SELAHATTİN GELBAL

  4. Eğitim fakülteleri Almanca öğretmenliği programı için eğitim teknolojisi açısından bir model

    Başlık çevirisi yok

    GÖNÜL DURUKAFA

    Doktora

    Türkçe

    Türkçe

    1994

    Eğitim ve ÖğretimDokuz Eylül Üniversitesi

    Eğitim Bilimleri Ana Bilim Dalı

    PROF. DR. GALİP KARAGÖZOĞLU