Geri Dön

Öğrencilerin PISA matematik başarılarının yordanmasında veri madenciliği yöntemlerinin karşılaştırılması

Comparison of data mining methods in predicting PISA mathematical achievements of students

  1. Tez No: 494325
  2. Yazar: İLHAN KOYUNCU
  3. Danışmanlar: PROF. DR. SELAHATTİN GELBAL
  4. Tez Türü: Doktora
  5. Konular: Eğitim ve Öğretim, Education and Training
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2018
  8. Dil: Türkçe
  9. Üniversite: Hacettepe Üniversitesi
  10. Enstitü: Eğitim Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Eğitim Bilimleri Ana Bilim Dalı
  12. Bilim Dalı: Eğitimde Ölçme ve Değerlendirme Bilim Dalı
  13. Sayfa Sayısı: 163

Özet

Bu çalışmanın amacı, PISA (2012) çalışmasına katılan öğrencileri, çeşitli özellikleri bakımından matematik başarılarına göre sınıflandırmada Naive Bayes, en yakın komşuluk, yapay sinir ağları ve lojistik regresyon analizlerinin sınıflandırma performanslarını örneklem büyüklüğü ve test verisi oranı açısından incelemektir. Araştırmanın evreni PISA (2012) uygulamasına katılan 15 yaş grubundaki öğrencilerdir. Hedef evren OECD ülkelerinden çalışmaya katılan ve ilgili değişkenlere ait kayıp verisi olmayan 62728 öğrencidir. Hedef evrenden yerine koyma yöntemiyle örneklem büyüklüğü için 500 (100 veri seti), 1000 (50 veri seti) ve 5000 (30 veri seti) kişilik 180 dosya oluşturulmuştur. Her bir örneklemden %11, %22, %33, %44 ve %55 oranında veri ile yöntemlerin performansları test edilmiştir. Verinin tek ve çok değişkenli analizlerin varsayımlarının ne düzeyde sağladığı kontrol edilmiştir. Her bir veri seti için test verisinin her defasında rastgele seçildiği 100 analiz gerçekleştirilmiştir. Değerlendirme ölçütleri olarak Kappa hata matrisi uyumu, ROC eğrisinin altında kalan alan ile doğruluk oranları ve standart sapma değerleri kullanırken manidar farklıkları da istatistiksel olarak test edilmiştir. Araştırma sonuçlarına göre, örneklem büyüklüğü arttıkça yöntemlerin sınıflandırma performansında artış görülürken, test verisi oranının artması yöntemlerin performanslarında farklı etkiler yaratmıştır. Naive Bayes yöntemi küçük örneklemlerde bile yüksek performans göstermiş, analizleri çok kısa sürede gerçekleştirmiş ve test verisi oranının değişiminden önemli düzeyde etkilenmemiştir. Lojistik regresyon analizi büyük örneklemlerde en etkili yöntem iken küçük örneklemlerde düşük performans göstermiştir. Yapay sinir ağları benzer bir eğilim gösterirken, genel olarak Naive Bayes ve lojistik regresyona göre daha düşük performans göstermiştir. Tüm koşullarda en düşük performanslar en yakın komşuluk yöntemi ile elde edilmiştir. Genel olarak, öğrencilerin matematik performanslarına göre sınıflandırılmasında yüksek doğruluk değerleri elde edilmiştir. Araştırmanın sonuç ve öneriler bölümünde bulgular detaylı bir şekilde ele alınarak teori ve uygulamaya yönelik bazı önerilerde bulunulmuştur.

Özet (Çeviri)

The purpose of this study is to examine the performance of Naive Bayes, nearest neighborhood, artificial neural networks, and logistic regression analysis in terms of sample size and test-data ratio in classifying students participated in the PISA (2012) study according to their mathematics performance. The population is students in the 15-year-old group who are participated in the PISA (2012) study. The target population is 62728 students from OECD countries who have participated in the study and have no missing data for the relevant variables. A total of 180 datasets were created by selecting from the target population for the sample sizes including 500 (100 datasets), 1000 (50 datasets) and 5000 (30 datasets) students. The performance of each algorithm was tested by using 11%, 22%, 33%, 44% and 55% of each dataset. It has been checked to what extent the assumptions of the univariate and multivariate analyzes satisfy. For each dataset, 100 analyzes in which test-sample is randomly selected at each time were performed. As the evaluation criteria, accuracy rates and their standard deviations, Kappa values and the area under ROC curve were used. For each dataset, methods' means of accuracy rates and their standard errors were statistically tested. According to the results of the study, while the classification performance of the methods increased as the sample size increased, the increase of the test-data ratio had different effects on the performance of the methods. The Naive Bayes method showed high performance even in small samples, performed the analyzes very quickly and was not affected by the change in the test-data ratio. Logistic regression analysis was the most effective method in large samples, but had poor performance in small samples. While neural networks method showed a similar tendency, its overall performance was lower than Naive Bayes and logistic regression. The lowest performances in all conditions were obtained by the nearest neighbor method. In the conclusions and suggestions part of the present study, the findings were discussed in detail and some suggestions for theory and practice were made.

Benzer Tezler

  1. Türk öğrencilerinin PISA başarılarının yordanmasında yapay sinir ağı ve lojistik regresyon modeli performanslarının karşılaştırılması

    Performance comparison of artificial neural network and logistic regression model in predicting Turkish students? PISA success

    TERCAN TEPEHAN

    Doktora

    Türkçe

    Türkçe

    2011

    Eğitim ve ÖğretimHacettepe Üniversitesi

    Eğitim Bilimleri Ana Bilim Dalı

    PROF. DR. SELAHATTİN GELBAL

  2. Liselere giriş sınavı beceri temelli yeni nesil matematik sorularına yönelik öğretmen ve öğrenci görüşleri (Van ili örneği)

    Teacher and student opinions on high school entrance exam skill-based new generation mathematics questions: Van province sample

    ONUR KALENDER

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    Eğitim ve ÖğretimIğdır Üniversitesi

    Matematik Ana Bilim Dalı

    DOÇ. DR. LOKMAN BİLEN

  3. Yapay sinir ağı, karar ağaçları ve ayırma analizi yöntemleri ile PISA 2012 matematik başarılarının sınıflandırılma performanslarının karşılaştırılması

    Comparison of classification performances of mathematics achievement at PISA 2012 with artificial neural network, decision trees and discriminant analysis

    EMRE TOPRAK

    Doktora

    Türkçe

    Türkçe

    2017

    Eğitim ve ÖğretimHacettepe Üniversitesi

    Eğitim Bilimleri Ana Bilim Dalı

    PROF. DR. SELAHATTİN GELBAL

  4. Matematik öğretmenlerinin beceri temelli sorulara yönelik algılayışları

    The perceptions of the mathematics teachers toward to skill-based questions

    ZEYNEP PELİN ÇOLAK

    Yüksek Lisans

    Türkçe

    Türkçe

    2022

    Eğitim ve ÖğretimMarmara Üniversitesi

    Matematik ve Fen Bilimleri Eğitimi Ana Bilim Dalı

    PROF. DR. EMİN AYDIN

    DOÇ. DR. ELİF BAHADIR

  5. PISA matematik alt test sorularına verilen cevapların bazı faktörlere göre incelenmesi(Kocaeli-Kartepe örneği)

    The analysis of the answers to PISA maths subtesrt questions according to certain factors(Kocaeli-Kartepe Case)

    SİBEL YİĞİT

    Yüksek Lisans

    Türkçe

    Türkçe

    2010

    Eğitim ve ÖğretimSakarya Üniversitesi

    Eğitim Bilimleri Bölümü

    YRD. DOÇ. DR. AHMET ESKİCUMALI