Geri Dön

Açıköğretim öğrencilerinin okul terkine etki eden faktörlerin veri madenciliği ile keşfi

Predicting the factors affecting school dropout in open and distance education students by using data mining

  1. Tez No: 906031
  2. Yazar: SELMA TOSUN
  3. Danışmanlar: PROF. DR. DİLARA BAKAN KALAYCIOĞLU
  4. Tez Türü: Doktora
  5. Konular: Eğitim ve Öğretim, Education and Training
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2024
  8. Dil: Türkçe
  9. Üniversite: Gazi Üniversitesi
  10. Enstitü: Eğitim Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Eğitim Bilimleri Ana Bilim Dalı
  12. Bilim Dalı: Eğitimde Ölçme ve Değerlendirme Bilim Dalı
  13. Sayfa Sayısı: 203

Özet

Bu çalışmanın amacı, açık ve uzaktan eğitimde okuyan öğrencilerin sistemler üzerinden elde edilebilecek verileri ile okul terki ve akademik başarı durumlarını tahmin etmek ve sınıflandırma performansı yüksek veri madenciliği modellerini belirleyerek bunlara göre akademik başarı ve okul terkinde etkili olan değişkenleri ortaya çıkartmaktır. Araştırmada, yükseköğretimdeki açık ve uzaktan eğitim öğrencilerinin demografik ve kişisel verileri ile ağırlıklı genel not ortalaması puanı değişken olarak alınarak okul terki riski taşıyan öğrencileri erken tespit edebilmek için veri madenciliği algoritmaları ile bir model geliştirilmiştir. Çalışmada veri madenciliği yaklaşımının eğitim alanında kullanılması ile bu algoritmalara dayalı olarak elde edilen sonuçların güvenirlik ve geçerlik değerlerinin ne düzeyde olduğu belirlenmiştir. Bu araştırma amacı bakımından nicel araştırma yöntemlerinden olan ilişkisel araştırma modelindedir. Araştırmanın türü, çalışma grubu, veri toplama araçları ve verilerin analizine yönelik işlemler, veri madenciliği için Alanlararası Standart Prosedürler (CRISP-DM) sürecinde yer alan aşamalar ile ilişkilendirilerek ele alınmıştır. Araştırma, İstanbul Üniversitesi Açık ve Uzaktan Eğitim Fakültesi'nde (İÜ AUZEF) 2021-2022 bahar dönemine kadar en az bir defa bir programa kayıt olan tüm öğrencilerin İstanbul Üniversitesi öğrenci bilgi sistemi veri tabanından elde edilen verileri ile yürütülmüştür. Analiz sürecinde okul terki ve akademik başarıya göre öğrencilerin sınıflandırılmasında Rastgele Ağaçlar, C&RT, C5.0, CHAID, QUEST gibi Karar Ağaçları İle Naive Bayes (NB), Lojistik Regresyon (LR), Yapay Sinir Ağları (YSA) ve Destek Vektör Makinesi (DVM) gibi çeşitli veri madenciliği algoritmaları kullanılmış ve bunların performansları doğruluk, duyarlılık, hassasiyet, kesinlik, negatif öngörü değeri, F1 puanı, MCC, AUC kriterlerine göre değerlendirilmiştir. Araştırmanın sonucunda okul terkine göre öğrencilerin sınıflandırılması için oluşturulan modellerin genel doğru sınıflandırma oranlarının 0,754 ile 0,790 arasında değiştiği görülmüştür. Tüm veri setinde genel sınıflandırma doğruluğu en yüksek model C5.0'dır. Ayrıca C5.0 modeli diğerlerine göre en yüksek duyarlılık, F1 puanı, kesinlik, negatif öngörü değeri ve MCC değerine de sahip olduğundan okul terkinin tahmininde modelin, diğerlerine göre performans değerlerinin daha iyi olduğu sonucuna varılmıştır. En yüksek hassasiyet C&RT modeli; en yüksek AUC değeri ise yapay sinir ağları modeli ile elde edildiği için bu üç modelin okul terkinin belirlenmesinde kullanılabileceği sonucuna ulaşılmış ve terkte etkili olan faktörler bunlar aracılığı ile ele alınmıştır. Modellerin okul terki için sınıflandırma yaparken ilk iki sırada ağırlıklı genel not ortalamasını ve öğrenci kayıt yılı faktörünü kullandığı; daha sonra ise modellere göre önem sırası farklılaşsa da program türü, yaş, kayıt/geliş şekli, öğrenim tipi, program düzeyi, ikamet ili ve cinsiyet değişkenlerinin sınıflandırmada etkili olduğu sonucuna ulaşılmıştır. Araştırma sonucunun okul terkinin azaltılmasına yönelik geliştirilecek stratejilere katkı sunması beklenmektedir.

Özet (Çeviri)

The aim of this study is to predict the dropout and academic success of students studying in open and distance education with the data that can be obtained through the systems and to determine the variables that are effective in academic success and dropout by determining data mining models with high classification performance. In the study, a model was developed with data mining algorithms to identify students at risk of dropout early by taking demographic and personal data of open and distance education students in higher education and weighted GPA score as variables. In the study, the use of data mining approach in the field of education and the level of reliability and validity values of the results obtained based on these algorithms were determined. This research is in the relational research model, which is one of the quantitative research methods in terms of its purpose. The type of the research, the study group, the data collection tools and the procedures for the analysis of the data were handled in relation to the stages in the process of the Cross-Regional Standard Procedures for Data Mining (CRISP-DM). The research was conducted with the data obtained from the Istanbul University student information system database of all students enrolled in a programme at least once until the 2021-2022 spring semester at Istanbul University Open and Distance Education Faculty (IU AUZEF). In the analysis process, decision trees such as Random Trees, C&RT, C5.0, CHAID, QUEST and various VM algorithms such as Naive Bayes (NB), Logistic Regression (LR), Artificial Neural Networks (ANN) and Support Vector Machine (SVM) were used to classify students according to dropout and academic achievement, and their performances were evaluated according to accuracy, sensitivity, precision, precision, negative predictive value, F1 score, MCC, AUC criteria. As a result of the study, it was observed that the overall correct classification rates of the models created for the classification of students according to school dropout ranged between 0.754 and 0.790. The model with the highest overall classification accuracy in the whole data set is C5.0. In addition, since the C5.0 model has the highest sensitivity, F1 score, precision, negative predictive value and MCC value compared to the others, it is concluded that the model has sufficient validity in predicting school dropout. Since the highest sensitivity was obtained with the C&RT model and the highest AUC value was obtained with the artificial neural networks model, it was concluded that these three models can be used in the determination of school dropout and the factors affecting dropout were addressed through them. It was concluded that the models used the weighted grade point average and the year of enrolment as the first two factors in classification for school dropout, and then the variables of programme type, age, enrolment/arrival type, education type, programme level, province of residence and gender were found to be effective in classification, although the order of importance differed according to the models. The results of the research are expected to contribute to the strategies to be developed to reduce school dropout.

Benzer Tezler

  1. Lise öğrencilerinde okul terki riskinin incelenmesi

    Investigation of school drop out among high school students

    ABDULVAHAP YORĞUN

    Doktora

    Türkçe

    Türkçe

    2014

    Eğitim ve ÖğretimHacettepe Üniversitesi

    Eğitim Bilimleri Ana Bilim Dalı

    PROF. DR. TUNCAY ERGENE

  2. Açık öğretim lisesi öğrenci ve mezunlarının katılım örüntüleri (Ankara ili Çankaya ilçesi örneği)

    The participation patterns of the students and the graduated open high school (Ankara city Çankaya province case)

    BEDİHA ŞAHİN

    Doktora

    Türkçe

    Türkçe

    2017

    Eğitim ve ÖğretimAnkara Üniversitesi

    Yaşam Boyu Öğrenme ve Yetişkin Eğitimi Ana Bilim Dalı

    PROF. DR. MERAL UYSAL

  3. Okul terki eğilimi olan ve olmayan öğrencilerin okul terki hakkındaki görüşleri: Bir durum çalışması

    Opinions of the students with and without tendency to drop out about school dropout: A case study

    TUĞGÜL VACİDE ERASLAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    Eğitim ve ÖğretimAnadolu Üniversitesi

    Eğitim Bilimleri Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ DERYA ATİK KARA

  4. Planlı dönemde yükseköğretim politikaları ve uygulamaları

    Başlık çevirisi yok

    TANER ÇAKIR

    Yüksek Lisans

    Türkçe

    Türkçe

    1993

    Eğitim ve ÖğretimAnkara Üniversitesi

    Eğitim Yönetimi ve Planlaması Ana Bilim Dalı

    PROF. DR. ZİYA BURSALIOĞLU

  5. Açık ve uzaktan eğitim öğrencilerinin okul bırakma sebepleri

    Causes of students drop out in open and distance education students

    MÜNEVVER ESGİCE

    Yüksek Lisans

    Türkçe

    Türkçe

    2015

    Eğitim ve ÖğretimAtatürk Üniversitesi

    Bilgisayar ve Öğretim Teknolojileri Eğitimi Ana Bilim Dalı

    DOÇ. DR. SELÇUK KARAMAN