Öğrencilerin PISA matematik başarılarının yordanmasında veri madenciliği yöntemlerinin karşılaştırılması

Comparison of data mining methods in predicting PISA mathematical achievements of students

PDF İndir

Tez No: 494325
Yazar: İLHAN KOYUNCU
Danışmanlar: PROF. DR. SELAHATTİN GELBAL
Tez Türü: Doktora
Konular: Eğitim ve Öğretim, Education and Training
Anahtar Kelimeler: Belirtilmemiş.
Yıl: 2018
Dil: Türkçe
Üniversite: Hacettepe Üniversitesi
Enstitü: Eğitim Bilimleri Enstitüsü
Ana Bilim Dalı: Eğitim Bilimleri Ana Bilim Dalı
Bilim Dalı: Eğitimde Ölçme ve Değerlendirme Bilim Dalı
Sayfa Sayısı: 163

Özet

Bu çalışmanın amacı, PISA (2012) çalışmasına katılan öğrencileri, çeşitli özellikleri bakımından matematik başarılarına göre sınıflandırmada Naive Bayes, en yakın komşuluk, yapay sinir ağları ve lojistik regresyon analizlerinin sınıflandırma performanslarını örneklem büyüklüğü ve test verisi oranı açısından incelemektir. Araştırmanın evreni PISA (2012) uygulamasına katılan 15 yaş grubundaki öğrencilerdir. Hedef evren OECD ülkelerinden çalışmaya katılan ve ilgili değişkenlere ait kayıp verisi olmayan 62728 öğrencidir. Hedef evrenden yerine koyma yöntemiyle örneklem büyüklüğü için 500 (100 veri seti), 1000 (50 veri seti) ve 5000 (30 veri seti) kişilik 180 dosya oluşturulmuştur. Her bir örneklemden %11, %22, %33, %44 ve %55 oranında veri ile yöntemlerin performansları test edilmiştir. Verinin tek ve çok değişkenli analizlerin varsayımlarının ne düzeyde sağladığı kontrol edilmiştir. Her bir veri seti için test verisinin her defasında rastgele seçildiği 100 analiz gerçekleştirilmiştir. Değerlendirme ölçütleri olarak Kappa hata matrisi uyumu, ROC eğrisinin altında kalan alan ile doğruluk oranları ve standart sapma değerleri kullanırken manidar farklıkları da istatistiksel olarak test edilmiştir. Araştırma sonuçlarına göre, örneklem büyüklüğü arttıkça yöntemlerin sınıflandırma performansında artış görülürken, test verisi oranının artması yöntemlerin performanslarında farklı etkiler yaratmıştır. Naive Bayes yöntemi küçük örneklemlerde bile yüksek performans göstermiş, analizleri çok kısa sürede gerçekleştirmiş ve test verisi oranının değişiminden önemli düzeyde etkilenmemiştir. Lojistik regresyon analizi büyük örneklemlerde en etkili yöntem iken küçük örneklemlerde düşük performans göstermiştir. Yapay sinir ağları benzer bir eğilim gösterirken, genel olarak Naive Bayes ve lojistik regresyona göre daha düşük performans göstermiştir. Tüm koşullarda en düşük performanslar en yakın komşuluk yöntemi ile elde edilmiştir. Genel olarak, öğrencilerin matematik performanslarına göre sınıflandırılmasında yüksek doğruluk değerleri elde edilmiştir. Araştırmanın sonuç ve öneriler bölümünde bulgular detaylı bir şekilde ele alınarak teori ve uygulamaya yönelik bazı önerilerde bulunulmuştur.

Özet (Çeviri)

The purpose of this study is to examine the performance of Naive Bayes, nearest neighborhood, artificial neural networks, and logistic regression analysis in terms of sample size and test-data ratio in classifying students participated in the PISA (2012) study according to their mathematics performance. The population is students in the 15-year-old group who are participated in the PISA (2012) study. The target population is 62728 students from OECD countries who have participated in the study and have no missing data for the relevant variables. A total of 180 datasets were created by selecting from the target population for the sample sizes including 500 (100 datasets), 1000 (50 datasets) and 5000 (30 datasets) students. The performance of each algorithm was tested by using 11%, 22%, 33%, 44% and 55% of each dataset. It has been checked to what extent the assumptions of the univariate and multivariate analyzes satisfy. For each dataset, 100 analyzes in which test-sample is randomly selected at each time were performed. As the evaluation criteria, accuracy rates and their standard deviations, Kappa values and the area under ROC curve were used. For each dataset, methods' means of accuracy rates and their standard errors were statistically tested. According to the results of the study, while the classification performance of the methods increased as the sample size increased, the increase of the test-data ratio had different effects on the performance of the methods. The Naive Bayes method showed high performance even in small samples, performed the analyzes very quickly and was not affected by the change in the test-data ratio. Logistic regression analysis was the most effective method in large samples, but had poor performance in small samples. While neural networks method showed a similar tendency, its overall performance was lower than Naive Bayes and logistic regression. The lowest performances in all conditions were obtained by the nearest neighbor method. In the conclusions and suggestions part of the present study, the findings were discussed in detail and some suggestions for theory and practice were made.

Benzer Tezler

Tez No
308559
Türk öğrencilerinin PISA başarılarının yordanmasında yapay sinir ağı ve lojistik regresyon modeli performanslarının karşılaştırılması
Performance comparison of artificial neural network and logistic regression model in predicting Turkish students? PISA success
TERCAN TEPEHAN
Doktora
Türkçe
2011
Eğitim ve Öğretim Hacettepe Üniversitesi
Eğitim Bilimleri Ana Bilim Dalı
PROF. DR. SELAHATTİN GELBAL
Tez No
832150
Liselere giriş sınavı beceri temelli yeni nesil matematik sorularına yönelik öğretmen ve öğrenci görüşleri (Van ili örneği)
Teacher and student opinions on high school entrance exam skill-based new generation mathematics questions: Van province sample
ONUR KALENDER
Yüksek Lisans
Türkçe
2023
Eğitim ve Öğretim Iğdır Üniversitesi
Matematik Ana Bilim Dalı
DOÇ. DR. LOKMAN BİLEN
Tez No
454924
Yapay sinir ağı, karar ağaçları ve ayırma analizi yöntemleri ile PISA 2012 matematik başarılarının sınıflandırılma performanslarının karşılaştırılması
Comparison of classification performances of mathematics achievement at PISA 2012 with artificial neural network, decision trees and discriminant analysis
EMRE TOPRAK
Doktora
Türkçe
2017
Eğitim ve Öğretim Hacettepe Üniversitesi
Eğitim Bilimleri Ana Bilim Dalı
PROF. DR. SELAHATTİN GELBAL
Tez No
748330
Matematik öğretmenlerinin beceri temelli sorulara yönelik algılayışları
The perceptions of the mathematics teachers toward to skill-based questions
ZEYNEP PELİN ÇOLAK
Yüksek Lisans
Türkçe
2022
Eğitim ve Öğretim Marmara Üniversitesi
Matematik ve Fen Bilimleri Eğitimi Ana Bilim Dalı
PROF. DR. EMİN AYDIN
DOÇ. DR. ELİF BAHADIR
Tez No
273161
PISA matematik alt test sorularına verilen cevapların bazı faktörlere göre incelenmesi(Kocaeli-Kartepe örneği)
The analysis of the answers to PISA maths subtesrt questions according to certain factors(Kocaeli-Kartepe Case)
SİBEL YİĞİT
Yüksek Lisans
Türkçe
2010
Eğitim ve Öğretim Sakarya Üniversitesi
Eğitim Bilimleri Bölümü
YRD. DOÇ. DR. AHMET ESKİCUMALI

Geri Dön