Makine öğrenmesi ile öğrenci başarı durumunun tahmin edilmesi
Prediction of student success status with machine learning
- Tez No: 943322
- Danışmanlar: DOÇ. DR. İBRAHİM BERKAN AYDİLEK
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2025
- Dil: Türkçe
- Üniversite: Harran Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 79
Özet
Bu çalışmada, öğrenci başarısının tahmin edilmesi amacıyla Kaggle platformundan beş farklı veri seti kullanılmıştır. Veri seti 1, 6607 gözlem ve 20 değişken; Veri seti 2, 10.000 gözlem ve 15 değişken; Veri seti 3, 1388 gözlem ve 5 değişken; Veri seti 4, 10.000 gözlem ve 6 değişken; Veri seti 5 ise 2392 gözlem ve 15 değişken içermektedir. Veri setleri üzerinde eksik ve aykırı değer analizi gerçekleştirilmiş, gerekli düzeltmeler yapılmıştır. Kategorik değişkenler label encoding yöntemiyle sayısal formata dönüştürülmüş, ardından korelasyon analizi yapılarak düşük korelasyona sahip değişkenler çıkarılmıştır. Ridge, Lineer, Lasso, Random Forest ve Destek Vektör Regresyonu (DVR) algoritmaları kullanılarak 10 kat çapraz doğrulama ile modellerin performansları belirleme katsayısı (R²), ortalama mutlak hata (MAE) ve kök ortalama kare hata (RMSE) metrikleri üzerinden değerlendirilmiştir. Standartlaştırma işlemi Z-skor yöntemiyle uygulanarak modeller tekrar eğitilmiş, hiperparametre optimizasyonu ise GridSearchCV ile gerçekleştirilmiştir. En iyi sonuçlar veri seti 1'de Random Forest algoritmasıyla (R²: 0.9553, MAE: 0.5586, RMSE: 0.7211), veri seti 2'de DVR ile (R²: 0.9407, MAE: 3.6525, RMSE: 4.2676), veri seti 3'te Random Forest ile (R²: 0.9940, MAE: 0.5378, RMSE: 0.7358), veri seti 4'te DVR ile (R²: 0.9999, MAE: 0.0762, RMSE: 0.1858) ve veri seti 5'te Lineer Regresyon ile (R²: 1.000, MAE: 0.000, RMSE: 0.000) elde edilmiştir. Son aşamada, öğrenci başarısının tahmin edilmesini sağlayan modelin gerçek veriler üzerinde nasıl çalıştığını gözlemlemek amacıyla bir web uygulaması geliştirilmiştir. Bu uygulama, öğrencilere özel başarı tahminleri sunarak kişiselleştirilmiş eğitim süreçlerinde karar destek mekanizması olarak kullanılabilirliğini göstermiştir. Çalışma sonucunda, veri ön işleme, model seçimi ve optimizasyon adımlarının tahmin doğruluğunu önemli ölçüde artırdığı ve makine öğrenimi modellerinin öğrenci başarısını yüksek doğrulukla tahmin edebildiği ortaya konmuştur.
Özet (Çeviri)
In this study, five different data sets from the Kaggle platform were used to predict student success. Data set 1 includes 6607 observations and 20 variables; Data set 2 includes 10,000 observations and 15 variables; Data set 3 includes 1388 observations and 5 variables; Data set 4 includes 10,000 observations and 6 variables; Data set 5 includes 2392 observations and 15 variables. Missing and outlier analysis was performed on the data sets, and necessary corrections were made. Categorical variables were converted to numerical format by label encoding method, and then correlation analysis was performed to remove variables with low correlation. The performances of the models were evaluated via coefficient of determination (R²), mean absolute error (MAE) and root mean square error (RMSE) metrics with 10-fold cross-validation using Ridge, Linear, Lasso, Random Forest and Support Vector Regression (SVR) algorithms. The models were re-trained by applying the standardization process with the Z-score method, and hyperparameter optimization was performed with GridSearchCV. The best results were obtained on dataset 1 with Random Forest algorithm (R²: 0.9553, MAE: 0.5586, RMSE: 0.7211), on dataset 2 with DVR (R²: 0.9407, MAE: 3.6525, RMSE: 4.2676), on dataset 3 with Random Forest (R²: 0.9940, MAE: 0.5378, RMSE: 0.7358), on dataset 4 with DVR (R²: 0.9999, MAE: 0.0762, RMSE: 0.1858) and on dataset 5 with Linear Regression (R²: 1.000, MAE: 0.000, RMSE: 0.000). In the final stage, a web application was developed to observe how the model that allows the prediction of student success works on real data. This application has demonstrated its usability as a decision support mechanism in personalized education processes by providing special success predictions for students. As a result of the study, it was revealed that data preprocessing, model selection and optimization steps significantly increased the prediction accuracy and that machine learning models can predict student success with high accuracy.
Benzer Tezler
- Derin öğrenme algoritmaları kullanarak öğrenci akademik performansının erken tahmini
Early prediction of student academic performance using deep learning algorithms
AHMET KALA
Doktora
Türkçe
2025
Endüstri ve Endüstri MühendisliğiSakarya ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
PROF. DR. ORHAN TORKUL
DR. ÖĞR. ÜYESİ TUĞBA YILDIZ
- PISA 2022 Türkiye örnekleminde bilgi ve iletişim teknolojisi kaynakları kullanımının okuma performansını yordama durumunun veri madenciliği teknikleriyle incelenmesi
Examining the predictive status of information and communication technology resources use on reading performance in PISA 2022 Turkey sample with data mining techniques
BARIŞ ŞAYBAK
Yüksek Lisans
Türkçe
2024
Eğitim ve ÖğretimBursa Uludağ ÜniversitesiBilgisayar ve Öğretim Teknolojileri Eğitimi Ana Bilim Dalı
DOÇ. DR. SALİH BİRİŞÇİ
- Using machine learning techniques to enhance teaching and performance prediction of students with autism spectrum disorders
Yapay öğrenme yöntemleri ile otizm spektrum bozukluğu olan öğrencilerin öğretiminin ve öğretim performansı tahmininin iyileştirilmesi
AKRAM M.M. RADWAN
Doktora
İngilizce
2016
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. ZEHRA ÇATALTEPE
- Dynamic data-driven optimization approach for flight selection problem
Uçuş seçimi problemi için dinamik veri odaklı optimizasyon yaklaşımı
ERDEM AKIN
Yüksek Lisans
İngilizce
2025
Endüstri ve Endüstri Mühendisliğiİstanbul Teknik ÜniversitesiVeri Mühendisliği ve İş Analitiği Ana Bilim Dalı
PROF. DR. BAŞAR ÖZTAYŞİ
- Ortaokul öğrencilerinin matematik dersi akademik başarılarının makine öğrenmesi algoritmaları ile tahmini
Prediction of secondary school students' academic achievement in mathematics with machine learning algorithms
BÜŞRA KARACA
Yüksek Lisans
Türkçe
2023
Eğitim ve ÖğretimSüleyman Demirel ÜniversitesiEğitim Bilimleri Ana Bilim Dalı
PROF. DR. MUHAMMET DEMİRBİLEK
DOÇ. DR. TARIK TALAN