Geri Dön

Ölçme araçlarının tutarlı ölçme ve sınıflama yapıp yapmadığını belirlemeye yönelik bir araştırma

A Study of the extent to which measurement instruments measure realably and classify correctly

  1. Tez No: 81577
  2. Yazar: ADNAN ERKUŞ
  3. Danışmanlar: PROF. DR. SÜLEYMAN ÖZOĞLU
  4. Tez Türü: Doktora
  5. Konular: Eğitim ve Öğretim, Education and Training
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 1999
  8. Dil: Türkçe
  9. Üniversite: Ankara Üniversitesi
  10. Enstitü: Sosyal Bilimler Enstitüsü
  11. Ana Bilim Dalı: Eğitimde Psikolojik Hizmetler Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 151

Özet

Psikometride iki temel değerlendirme biçimi vardır. İlki, bir bireyin puanının, o bireyin içinde bulunduğu grubun ölçülerine göre yerinin belirlenmesini içerir ki, buna norm-dayanaklı değerlendirme denir. İkincisi, bireyin puanının grubun ölçülerinden bağımsız olarak, bir kesme noktasına ya da testten alınabilecek maksimum puana göre değerlendirilmesini içeren ölçüt-dayanaklı değerlendirmedir. Öte yandan, ölçme araçlarının iki temel özelliği bulunmaktadır: Güvenirlilik ve geçerlilik. Güvenirlilik, bir ölçme aracının hatalardan arınıklık derecesini gösterirken; geçerlilik, o ölçme aracının kullanılma amacına hizmet etme derecesinin kanıtını verir. Özellikle ölçüt-dayanaklı değerlendirme bağlamında geliştirilen sınıflama tutarlılığı indekslerinin, tarihsel süreç içinde güvenirlilik olarak adlandırılmasının bir kavram karmaşasına yol açtığı görülmektedir. Yine, bir ölçme aracının güvenirliliği ile geçerliliğinin, pek çok kaynakta kesin çizgilerle birbirinden ayrıldığına tanık olunmaktadır. Oysa bazı durumlarda, güvenirlilik ile geçerlilik aynı indeks üzerinde anlam kazanabilmektedir; örneğin, Cronbach Alfa içtutarlılık katsayısı gibi. Klasik güvenirlilik belirleme yolları ile sınıflama tutarlılığı indekslerinin bu açıdan yeniden ele alınması ve yeni bir kavramlaştırmaya gidilmesi gerekmektedir. Öte yandan, ölçüt- dayanaklı değerlendirme bağlamında geliştirilen sınıflama tutarlılığı indekslerinin hemen tümünün testin özelliklerinden bağımsız olarak ve bir anlamda keyfî olarak belirlenen bir kesme puanına dayanmasından kaynaklanan sakıncalarının görgül olarak saptandığı pek çok çalışma da bulunmaktadır. Yukarıdaki sorunlardan ve özellikle de sınıflama tutarlılığı indekslerinin bir kesme puanına dayanmasından kaynaklanan sakıncaları bertaraf etme düşüncesinden hareketle, Çift-Tutarlılık İndeksi olarak adlandırılan ve bilinen bazı yöntemleri biraraya getirerek yeni bir indeks oluşturulmuştur. İndeksin geliştirilme yöntemi; test maddelerinin tekler-çiftler şeklinde iki yarıya101 ayrılıp iki yarıda her bireyin toplam puanlarının bulunmasına, bu toplam puanların büyükten küçüğe doğru ( ya da tersi) sıralanmasından sonra her iki yarıda alt ve üst %27'lik grupların arasındaki uyuma bakılmasına dayanmaktadır. Çift-tutarlılık indeksi; eğer test tutarlı bir sınıflama yapıyorsa (bir anlamda tutarlı ayır ediyorsa), testin ilk yarısında üst grupta (başarılı) sınıflanan bireylerin ikinci yarıda da üst grupta; ilk yarıda alt grupta (başarısız) sınıflanan bireylerin ikinci yarıda da alt grupta sınıflanmasının beklenmesi rasyonaline dayanmaktadır. Testin her iki yarısındaki alt ve üst % 27'lik gruplardaki frekans farklarıyla, 0.00 ile 1.00 arasında değerler alan indekse ulaşılmaktadır: p = 1- 1 ÇT l {j ÜT Jfjç' + ^JAT JAÇ) "ü+A İndeks değeri 0.00'a yaklaştığında tutarsız sınıflamayı, 1.00'e yaklaştığında da tutarlı sınıflamayı göstermektedir. Bu çalışmada, çift-tutarlılık indeksinin; kullanılan uç grupların büyüklüğüne, örneklem büyüklüğüne, testteki madde sayısına ve test maddelerinin puanlanma biçimine göre değişip değişmediği ile toplam test puanı ve alt-üst puan varyanslarıyla ilişkisine bakılmıştır. Görgül çalışmada, araştırmacının geliştirdiği iki ölçek verileri temel alınmıştır. Likert tipi ölçek verileri (ÖİTÖ) 295, yetenek alt- testi (FKBYT) verileri ise 446 denek üzerinden elde edilmiştir. Yapılan analizler sonucunda: 1. a) uç grup yüzdeleri küçüldükçe indeks değerinin de küçüldüğü, indeks değerinin maksimum değerini %27'lik gruplarda aldığı; b) ÖİTÖ verileri için örneklem küçüldüğünde indeks değerinin arttığı, FKBYT verileri için ise tersine azaldığı; c) her iki ölçek verileri için madde sayısının (k) azalmasına bağlı olarak indeks değerinin de azaldığı; d) maddeleri çoklu puanlanan (ÖİTÖ) testlerin ikili puanlanan testlere (FKBYT) göre indeks değerlerinin daha yüksek olduğu102 gözlenmiştir. 2. İndeks değerinin, test toplam puanı düştükçe azaldığı, ancak ÖİTÖ verileri için n azaldığında ve k sabit kaldığında arttığı; FKBYT verileri için ise tersine azaldığı; alt-üst grup varyanslarından çok, n, k ve yüzde gruplarının büyüklüğünden etkilendiği bulunmuştur. Ayrıca, karşılaşılabilecek özel durumlar için bazı işlemler ve önerilerde bulunulmuştur. Sonuç olarak, çift-tutarlılık indeksinin diğer indekslere göre hesaplanmasının kolay olduğu; hem ikili hem de çoklu puanlanan testlerin verilerine uygulanabileceği, ancak çoklu puanlanan testlerde daha tutarlı sonuçlar elde edileceği; testin hem sınıflama hem de sıralama tutarlılığı hakkında bilgi verdiği; testin hem güvenirlilik hem de geçerlilik kanıtlarını içerdiği; hem norm- dayanaklı hem de ölçüt-dayanaklı değerlendirmeler arasında yer aldığı ileri sürülebilir. Ancak, yeni olan bu indeksin üzerinde başka çalışmalara, özellikle de dağılım fonksiyonunun çalışılmasına gereksinim vardır.

Özet (Çeviri)

There are two ways of assessment in psychometrics: The first one is the norm-referenced assessment which determines the position of an individual score in a group; the second one is the criterion-referenced assessment which evaluates an individual score by depending on a cut-point or maximum test score, independly from the group. Morever, there are two features of psychological tests: Reliability and validity. Reliability is the extent of unerrorness of the test; validity is the extent of appropriatness of a test regarding its aim. Specially it appears that the classification consistency indices developed in the criterion-referenced context are identified as reliability, and this case has also resulted in a concept confusion. On the other hand, it has been empirically shown that these indices have been influced by the position of cutoff score on the test. In this study, a new index (cutoff score free) combining some traditional methods has been proposed, and a formulae has been developed. This new index (double-consistency index) has based on spliting of test items as odd-even items, calculating the total score of each individual in two splits, sorting of these total scores, and then evaluating agreement between up-low 27% of groups in each split. The index's rationale has based on the expectation that If an individual classified in 27% up-group in the first split is also classified in 27% up-group in the second split (for low 27%, at the same way), then that means the test is consistent. The value of index is between 0.00 and 1.00. Double- consistency index formulae is: Fcr=1l ^ J In this study, it has been investigated whether the double- consistency index changes in relation to the percentage of the104 extreme groups, the number of individuals in the sample, the number of items on the test, and the way of scoring the test items. Morever, the relationship between the index and variations of total score has been investigated. In this empirical study, data gathered by a Likert type scale (ÖİTÖ) and a dichotomously scored aptitude test (FKBYT) developed by researcher has been used. Analyses of data have shown that: 1. a) for both data sets, Double-consistency index decreases as the percents of the extreme groups decrease; b) for ÖİTÖ data, the value of index decreases as the number of individuals in the sample decreases; on the other hand, for FKBYT data, the value of index increases as the number of individuals in the sample decreases; c) the index's value decreases depending on decrement of the number of items (k) for each scale; d) the index's value increases as the scoring of the items is continous. 2. a) The index's value decreases as the total test score decreases; but, for ÖİTÖ data, it increases as n decreases while k is kept constant; for FKBYT data, the opposite is found to be true. The index is influced by n, k and the percent groups. Morever, for the value of index, some procedures and proposals has been made. As a result, the index; a) is easier to calculate than the other indices, b) can be applied to both dichotomously and polytomously scored tests, c) gives information about both classification and ordinal consistency of the test, d) gives both reliability and validity evidences, e) is situated between norm-referenced and criterion- referenced assessments. But, it needs further studies especially about its distribution function.

Benzer Tezler

  1. Development of QCM sensors for measuring particulate matter concentration

    QCM sensörlerinin partikül madde konsantrasyonunu ölçmek için geliştirilmesi

    MAJID JAVADZADEHKALKHORAN

    Doktora

    İngilizce

    İngilizce

    2024

    Makine Mühendisliğiİstanbul Teknik Üniversitesi

    Makine Mühendisliği Ana Bilim Dalı

    PROF. DR. LEVENT TRABZON

  2. Bı̇lı̇msel üretkenlı̇k testı̇nı̇n 3, 4 ve 5. sınıf öğrencı̇lerı̇ne uygun formunun gelı̇ştı̇rı̇lmesı̇ ve ön psı̇kometrı̇k özellı̇klerı̇nı̇n ı̇ncelenmesı̇

    Developing creative scientific ability test for 3rd, 4th, and 5th graders and analysis of its pre-psychometric properties

    MUHAMMET BAHADIR AYAS

    Doktora

    Türkçe

    Türkçe

    2017

    Eğitim ve ÖğretimAnadolu Üniversitesi

    Özel Eğitim Ana Bilim Dalı

    PROF. DR. UĞUR SAK

  3. Matematiksel üretkenlik testi (MÜT)'nin ilköğretim 6. 7. ve 8. sınıflar düzeyinde psikometrik özelliklerinin incelenmesi

    A research study on psychometric properties of the creative mathematical ability test (C-MAT)

    YELİZ TÜRKAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2010

    Eğitim ve ÖğretimAnadolu Üniversitesi

    Özel Eğitim Bölümü

    DOÇ. DR. UĞUR SAK

  4. İlahiyat eğitiminin kimlik ve ahlaki yargı gelişimine etkisi

    The effect of theology education on the development of identity and moral judgment

    MUHYETTİN ÖZEN

    Doktora

    Türkçe

    Türkçe

    2021

    DinAnkara Üniversitesi

    Felsefe ve Din Bilimleri Ana Bilim Dalı

    PROF. DR. YILDIZ KIZILABDULLAH