Ölçme araçlarının tutarlı ölçme ve sınıflama yapıp yapmadığını belirlemeye yönelik bir araştırma

A Study of the extent to which measurement instruments measure realably and classify correctly

Tez No: 81577
Yazar: ADNAN ERKUŞ
Danışmanlar: PROF. DR. SÜLEYMAN ÖZOĞLU
Tez Türü: Doktora
Konular: Eğitim ve Öğretim, Education and Training
Anahtar Kelimeler: Belirtilmemiş.
Yıl: 1999
Dil: Türkçe
Üniversite: Ankara Üniversitesi
Enstitü: Sosyal Bilimler Enstitüsü
Ana Bilim Dalı: Eğitimde Psikolojik Hizmetler Ana Bilim Dalı
Bilim Dalı: Belirtilmemiş.
Sayfa Sayısı: 151

Özet

Psikometride iki temel değerlendirme biçimi vardır. İlki, bir bireyin puanının, o bireyin içinde bulunduğu grubun ölçülerine göre yerinin belirlenmesini içerir ki, buna norm-dayanaklı değerlendirme denir. İkincisi, bireyin puanının grubun ölçülerinden bağımsız olarak, bir kesme noktasına ya da testten alınabilecek maksimum puana göre değerlendirilmesini içeren ölçüt-dayanaklı değerlendirmedir. Öte yandan, ölçme araçlarının iki temel özelliği bulunmaktadır: Güvenirlilik ve geçerlilik. Güvenirlilik, bir ölçme aracının hatalardan arınıklık derecesini gösterirken; geçerlilik, o ölçme aracının kullanılma amacına hizmet etme derecesinin kanıtını verir. Özellikle ölçüt-dayanaklı değerlendirme bağlamında geliştirilen sınıflama tutarlılığı indekslerinin, tarihsel süreç içinde güvenirlilik olarak adlandırılmasının bir kavram karmaşasına yol açtığı görülmektedir. Yine, bir ölçme aracının güvenirliliği ile geçerliliğinin, pek çok kaynakta kesin çizgilerle birbirinden ayrıldığına tanık olunmaktadır. Oysa bazı durumlarda, güvenirlilik ile geçerlilik aynı indeks üzerinde anlam kazanabilmektedir; örneğin, Cronbach Alfa içtutarlılık katsayısı gibi. Klasik güvenirlilik belirleme yolları ile sınıflama tutarlılığı indekslerinin bu açıdan yeniden ele alınması ve yeni bir kavramlaştırmaya gidilmesi gerekmektedir. Öte yandan, ölçüt- dayanaklı değerlendirme bağlamında geliştirilen sınıflama tutarlılığı indekslerinin hemen tümünün testin özelliklerinden bağımsız olarak ve bir anlamda keyfî olarak belirlenen bir kesme puanına dayanmasından kaynaklanan sakıncalarının görgül olarak saptandığı pek çok çalışma da bulunmaktadır. Yukarıdaki sorunlardan ve özellikle de sınıflama tutarlılığı indekslerinin bir kesme puanına dayanmasından kaynaklanan sakıncaları bertaraf etme düşüncesinden hareketle, Çift-Tutarlılık İndeksi olarak adlandırılan ve bilinen bazı yöntemleri biraraya getirerek yeni bir indeks oluşturulmuştur. İndeksin geliştirilme yöntemi; test maddelerinin tekler-çiftler şeklinde iki yarıya101 ayrılıp iki yarıda her bireyin toplam puanlarının bulunmasına, bu toplam puanların büyükten küçüğe doğru ( ya da tersi) sıralanmasından sonra her iki yarıda alt ve üst %27'lik grupların arasındaki uyuma bakılmasına dayanmaktadır. Çift-tutarlılık indeksi; eğer test tutarlı bir sınıflama yapıyorsa (bir anlamda tutarlı ayır ediyorsa), testin ilk yarısında üst grupta (başarılı) sınıflanan bireylerin ikinci yarıda da üst grupta; ilk yarıda alt grupta (başarısız) sınıflanan bireylerin ikinci yarıda da alt grupta sınıflanmasının beklenmesi rasyonaline dayanmaktadır. Testin her iki yarısındaki alt ve üst % 27'lik gruplardaki frekans farklarıyla, 0.00 ile 1.00 arasında değerler alan indekse ulaşılmaktadır: p = 1- 1 ÇT l {j ÜT Jfjç' + ^JAT JAÇ) "ü+A İndeks değeri 0.00'a yaklaştığında tutarsız sınıflamayı, 1.00'e yaklaştığında da tutarlı sınıflamayı göstermektedir. Bu çalışmada, çift-tutarlılık indeksinin; kullanılan uç grupların büyüklüğüne, örneklem büyüklüğüne, testteki madde sayısına ve test maddelerinin puanlanma biçimine göre değişip değişmediği ile toplam test puanı ve alt-üst puan varyanslarıyla ilişkisine bakılmıştır. Görgül çalışmada, araştırmacının geliştirdiği iki ölçek verileri temel alınmıştır. Likert tipi ölçek verileri (ÖİTÖ) 295, yetenek alt- testi (FKBYT) verileri ise 446 denek üzerinden elde edilmiştir. Yapılan analizler sonucunda: 1. a) uç grup yüzdeleri küçüldükçe indeks değerinin de küçüldüğü, indeks değerinin maksimum değerini %27'lik gruplarda aldığı; b) ÖİTÖ verileri için örneklem küçüldüğünde indeks değerinin arttığı, FKBYT verileri için ise tersine azaldığı; c) her iki ölçek verileri için madde sayısının (k) azalmasına bağlı olarak indeks değerinin de azaldığı; d) maddeleri çoklu puanlanan (ÖİTÖ) testlerin ikili puanlanan testlere (FKBYT) göre indeks değerlerinin daha yüksek olduğu102 gözlenmiştir. 2. İndeks değerinin, test toplam puanı düştükçe azaldığı, ancak ÖİTÖ verileri için n azaldığında ve k sabit kaldığında arttığı; FKBYT verileri için ise tersine azaldığı; alt-üst grup varyanslarından çok, n, k ve yüzde gruplarının büyüklüğünden etkilendiği bulunmuştur. Ayrıca, karşılaşılabilecek özel durumlar için bazı işlemler ve önerilerde bulunulmuştur. Sonuç olarak, çift-tutarlılık indeksinin diğer indekslere göre hesaplanmasının kolay olduğu; hem ikili hem de çoklu puanlanan testlerin verilerine uygulanabileceği, ancak çoklu puanlanan testlerde daha tutarlı sonuçlar elde edileceği; testin hem sınıflama hem de sıralama tutarlılığı hakkında bilgi verdiği; testin hem güvenirlilik hem de geçerlilik kanıtlarını içerdiği; hem norm- dayanaklı hem de ölçüt-dayanaklı değerlendirmeler arasında yer aldığı ileri sürülebilir. Ancak, yeni olan bu indeksin üzerinde başka çalışmalara, özellikle de dağılım fonksiyonunun çalışılmasına gereksinim vardır.

Özet (Çeviri)

There are two ways of assessment in psychometrics: The first one is the norm-referenced assessment which determines the position of an individual score in a group; the second one is the criterion-referenced assessment which evaluates an individual score by depending on a cut-point or maximum test score, independly from the group. Morever, there are two features of psychological tests: Reliability and validity. Reliability is the extent of unerrorness of the test; validity is the extent of appropriatness of a test regarding its aim. Specially it appears that the classification consistency indices developed in the criterion-referenced context are identified as reliability, and this case has also resulted in a concept confusion. On the other hand, it has been empirically shown that these indices have been influced by the position of cutoff score on the test. In this study, a new index (cutoff score free) combining some traditional methods has been proposed, and a formulae has been developed. This new index (double-consistency index) has based on spliting of test items as odd-even items, calculating the total score of each individual in two splits, sorting of these total scores, and then evaluating agreement between up-low 27% of groups in each split. The index's rationale has based on the expectation that If an individual classified in 27% up-group in the first split is also classified in 27% up-group in the second split (for low 27%, at the same way), then that means the test is consistent. The value of index is between 0.00 and 1.00. Double- consistency index formulae is: Fcr=1l ^ J In this study, it has been investigated whether the double- consistency index changes in relation to the percentage of the104 extreme groups, the number of individuals in the sample, the number of items on the test, and the way of scoring the test items. Morever, the relationship between the index and variations of total score has been investigated. In this empirical study, data gathered by a Likert type scale (ÖİTÖ) and a dichotomously scored aptitude test (FKBYT) developed by researcher has been used. Analyses of data have shown that: 1. a) for both data sets, Double-consistency index decreases as the percents of the extreme groups decrease; b) for ÖİTÖ data, the value of index decreases as the number of individuals in the sample decreases; on the other hand, for FKBYT data, the value of index increases as the number of individuals in the sample decreases; c) the index's value decreases depending on decrement of the number of items (k) for each scale; d) the index's value increases as the scoring of the items is continous. 2. a) The index's value decreases as the total test score decreases; but, for ÖİTÖ data, it increases as n decreases while k is kept constant; for FKBYT data, the opposite is found to be true. The index is influced by n, k and the percent groups. Morever, for the value of index, some procedures and proposals has been made. As a result, the index; a) is easier to calculate than the other indices, b) can be applied to both dichotomously and polytomously scored tests, c) gives information about both classification and ordinal consistency of the test, d) gives both reliability and validity evidences, e) is situated between norm-referenced and criterion- referenced assessments. But, it needs further studies especially about its distribution function.

Benzer Tezler

Tez No
876344
Development of QCM sensors for measuring particulate matter concentration
QCM sensörlerinin partikül madde konsantrasyonunu ölçmek için geliştirilmesi
MAJID JAVADZADEHKALKHORAN
Doktora
İngilizce
2024
Makine Mühendisliği İstanbul Teknik Üniversitesi
Makine Mühendisliği Ana Bilim Dalı
PROF. DR. LEVENT TRABZON
Tez No
486200
Bı̇lı̇msel üretkenlı̇k testı̇nı̇n 3, 4 ve 5. sınıf öğrencı̇lerı̇ne uygun formunun gelı̇ştı̇rı̇lmesı̇ ve ön psı̇kometrı̇k özellı̇klerı̇nı̇n ı̇ncelenmesı̇
Developing creative scientific ability test for 3rd, 4th, and 5th graders and analysis of its pre-psychometric properties
MUHAMMET BAHADIR AYAS
Doktora
Türkçe
2017
Eğitim ve Öğretim Anadolu Üniversitesi
Özel Eğitim Ana Bilim Dalı
PROF. DR. UĞUR SAK
Tez No
26792
Transliteral equivalence and reliability of the Turkish form of the problem solving subtest of the career maturity inventory ; A study on 8 th-Grade Turkish students
Başlık çevirisi yok
DARYO BAHAR
Yüksek Lisans
İngilizce
1993
Eğitim ve Öğretim Boğaziçi Üniversitesi
Eğitim Bilimleri Ana Bilim Dalı
DOÇ. DR. FATOŞ ERKMAN
Tez No
263145
Matematiksel üretkenlik testi (MÜT)'nin ilköğretim 6. 7. ve 8. sınıflar düzeyinde psikometrik özelliklerinin incelenmesi
A research study on psychometric properties of the creative mathematical ability test (C-MAT)
YELİZ TÜRKAN
Yüksek Lisans
Türkçe
2010
Eğitim ve Öğretim Anadolu Üniversitesi
Özel Eğitim Bölümü
DOÇ. DR. UĞUR SAK
Tez No
721693
İlahiyat eğitiminin kimlik ve ahlaki yargı gelişimine etkisi
The effect of theology education on the development of identity and moral judgment
MUHYETTİN ÖZEN
Doktora
Türkçe
2021
Din Ankara Üniversitesi
Felsefe ve Din Bilimleri Ana Bilim Dalı
PROF. DR. YILDIZ KIZILABDULLAH

Geri Dön