Geri Dön

Makine öğrenmesi ile öğrenci başarı durumunun tahmin edilmesi

Prediction of student success status with machine learning

  1. Tez No: 943322
  2. Yazar: MÜSLÜME KARAKAYA
  3. Danışmanlar: DOÇ. DR. İBRAHİM BERKAN AYDİLEK
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2025
  8. Dil: Türkçe
  9. Üniversite: Harran Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 79

Özet

Bu çalışmada, öğrenci başarısının tahmin edilmesi amacıyla Kaggle platformundan beş farklı veri seti kullanılmıştır. Veri seti 1, 6607 gözlem ve 20 değişken; Veri seti 2, 10.000 gözlem ve 15 değişken; Veri seti 3, 1388 gözlem ve 5 değişken; Veri seti 4, 10.000 gözlem ve 6 değişken; Veri seti 5 ise 2392 gözlem ve 15 değişken içermektedir. Veri setleri üzerinde eksik ve aykırı değer analizi gerçekleştirilmiş, gerekli düzeltmeler yapılmıştır. Kategorik değişkenler label encoding yöntemiyle sayısal formata dönüştürülmüş, ardından korelasyon analizi yapılarak düşük korelasyona sahip değişkenler çıkarılmıştır. Ridge, Lineer, Lasso, Random Forest ve Destek Vektör Regresyonu (DVR) algoritmaları kullanılarak 10 kat çapraz doğrulama ile modellerin performansları belirleme katsayısı (R²), ortalama mutlak hata (MAE) ve kök ortalama kare hata (RMSE) metrikleri üzerinden değerlendirilmiştir. Standartlaştırma işlemi Z-skor yöntemiyle uygulanarak modeller tekrar eğitilmiş, hiperparametre optimizasyonu ise GridSearchCV ile gerçekleştirilmiştir. En iyi sonuçlar veri seti 1'de Random Forest algoritmasıyla (R²: 0.9553, MAE: 0.5586, RMSE: 0.7211), veri seti 2'de DVR ile (R²: 0.9407, MAE: 3.6525, RMSE: 4.2676), veri seti 3'te Random Forest ile (R²: 0.9940, MAE: 0.5378, RMSE: 0.7358), veri seti 4'te DVR ile (R²: 0.9999, MAE: 0.0762, RMSE: 0.1858) ve veri seti 5'te Lineer Regresyon ile (R²: 1.000, MAE: 0.000, RMSE: 0.000) elde edilmiştir. Son aşamada, öğrenci başarısının tahmin edilmesini sağlayan modelin gerçek veriler üzerinde nasıl çalıştığını gözlemlemek amacıyla bir web uygulaması geliştirilmiştir. Bu uygulama, öğrencilere özel başarı tahminleri sunarak kişiselleştirilmiş eğitim süreçlerinde karar destek mekanizması olarak kullanılabilirliğini göstermiştir. Çalışma sonucunda, veri ön işleme, model seçimi ve optimizasyon adımlarının tahmin doğruluğunu önemli ölçüde artırdığı ve makine öğrenimi modellerinin öğrenci başarısını yüksek doğrulukla tahmin edebildiği ortaya konmuştur.

Özet (Çeviri)

In this study, five different data sets from the Kaggle platform were used to predict student success. Data set 1 includes 6607 observations and 20 variables; Data set 2 includes 10,000 observations and 15 variables; Data set 3 includes 1388 observations and 5 variables; Data set 4 includes 10,000 observations and 6 variables; Data set 5 includes 2392 observations and 15 variables. Missing and outlier analysis was performed on the data sets, and necessary corrections were made. Categorical variables were converted to numerical format by label encoding method, and then correlation analysis was performed to remove variables with low correlation. The performances of the models were evaluated via coefficient of determination (R²), mean absolute error (MAE) and root mean square error (RMSE) metrics with 10-fold cross-validation using Ridge, Linear, Lasso, Random Forest and Support Vector Regression (SVR) algorithms. The models were re-trained by applying the standardization process with the Z-score method, and hyperparameter optimization was performed with GridSearchCV. The best results were obtained on dataset 1 with Random Forest algorithm (R²: 0.9553, MAE: 0.5586, RMSE: 0.7211), on dataset 2 with DVR (R²: 0.9407, MAE: 3.6525, RMSE: 4.2676), on dataset 3 with Random Forest (R²: 0.9940, MAE: 0.5378, RMSE: 0.7358), on dataset 4 with DVR (R²: 0.9999, MAE: 0.0762, RMSE: 0.1858) and on dataset 5 with Linear Regression (R²: 1.000, MAE: 0.000, RMSE: 0.000). In the final stage, a web application was developed to observe how the model that allows the prediction of student success works on real data. This application has demonstrated its usability as a decision support mechanism in personalized education processes by providing special success predictions for students. As a result of the study, it was revealed that data preprocessing, model selection and optimization steps significantly increased the prediction accuracy and that machine learning models can predict student success with high accuracy.

Benzer Tezler

  1. Derin öğrenme algoritmaları kullanarak öğrenci akademik performansının erken tahmini

    Early prediction of student academic performance using deep learning algorithms

    AHMET KALA

    Doktora

    Türkçe

    Türkçe

    2025

    Endüstri ve Endüstri MühendisliğiSakarya Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    PROF. DR. ORHAN TORKUL

    DR. ÖĞR. ÜYESİ TUĞBA YILDIZ

  2. PISA 2022 Türkiye örnekleminde bilgi ve iletişim teknolojisi kaynakları kullanımının okuma performansını yordama durumunun veri madenciliği teknikleriyle incelenmesi

    Examining the predictive status of information and communication technology resources use on reading performance in PISA 2022 Turkey sample with data mining techniques

    BARIŞ ŞAYBAK

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    Eğitim ve ÖğretimBursa Uludağ Üniversitesi

    Bilgisayar ve Öğretim Teknolojileri Eğitimi Ana Bilim Dalı

    DOÇ. DR. SALİH BİRİŞÇİ

  3. Using machine learning techniques to enhance teaching and performance prediction of students with autism spectrum disorders

    Yapay öğrenme yöntemleri ile otizm spektrum bozukluğu olan öğrencilerin öğretiminin ve öğretim performansı tahmininin iyileştirilmesi

    AKRAM M.M. RADWAN

    Doktora

    İngilizce

    İngilizce

    2016

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. ZEHRA ÇATALTEPE

  4. Dynamic data-driven optimization approach for flight selection problem

    Uçuş seçimi problemi için dinamik veri odaklı optimizasyon yaklaşımı

    ERDEM AKIN

    Yüksek Lisans

    İngilizce

    İngilizce

    2025

    Endüstri ve Endüstri Mühendisliğiİstanbul Teknik Üniversitesi

    Veri Mühendisliği ve İş Analitiği Ana Bilim Dalı

    PROF. DR. BAŞAR ÖZTAYŞİ

  5. Ortaokul öğrencilerinin matematik dersi akademik başarılarının makine öğrenmesi algoritmaları ile tahmini

    Prediction of secondary school students' academic achievement in mathematics with machine learning algorithms

    BÜŞRA KARACA

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    Eğitim ve ÖğretimSüleyman Demirel Üniversitesi

    Eğitim Bilimleri Ana Bilim Dalı

    PROF. DR. MUHAMMET DEMİRBİLEK

    DOÇ. DR. TARIK TALAN