Eğitimde veri madenciliği ve öğrenci akademik başarı öngörüsüne ilişkin bir uygulama
Educational data mining and an application related to prediction of student academic success
- Tez No: 418777
- Danışmanlar: PROF. DR. MEHMET ERDAL BALABAN
- Tez Türü: Doktora
- Konular: Bilim ve Teknoloji, Eğitim ve Öğretim, İstatistik, Science and Technology, Education and Training, Statistics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2016
- Dil: Türkçe
- Üniversite: İstanbul Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Enformatik Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 191
Özet
Eğitim-öğretim süreci ve bu sürece ilişkin tüm faaliyetler toplumların geleceğine yön verebilme gücüne sahiptir. Bu açıdan değerlendirildiğinde sürecin girdi, çıktı ve diğer süreç elemanları bakımından sıklıkla analiz edilmesi gerektiğini söylemek mümkündür. Her ne kadar bu analiz; mikro ve makro düzeyde başarı ölçme sınavları ile gerçekleştirilmekte olsa da, elde edilen başarının“istenilen başarıya olan yakınsaklığı”, girdi sayısı göz önüne alındığında tartışmalıdır. Bu nedenle çeşitli faktörlerle girdinin istenen başarı düzeyine sahip çıktıya dönüşüm sürecinin önceden kestirilmesi; süreçteki aksaklıklara müdahale edilmesi gereken durumların farkındalığının oluşturulması açısından önemlidir. Tezin en genel biçimde amacı; klasik eğitim-öğretim sürecindeki, öğrenci girdisinin başarılı öğrenciye dönüşüm sürecinde literatürde yer verilen faktörlerin etkisi ışığında, başarı anlamında nasıl bir çıktı oluşturacağının öngörülmesine dayanmaktadır. Bu öngörünün oluşturulmasında, günümüzde verinin analizi açısından yararı kanıtlanmış veri madenciliği yöntemlerinden sınıflandırma teknikleri kullanılmıştır. Tezin sınırları daha özelleştirilmiş amacı ise; lise düzeyindeki öğrencilerin klasik eğitim ortamına ait akademik başarılarının, sınıflandırma teknikleri kullanılarak belirlenebilmesidir. Akademik başarıyı etkilen faktörler olarak sosyo-demografik değişkenler (yaş, cinsiyet, İstanbul'da ikamet süresi, anne-baba birlikteliği, annenin eğitim durumu, babanın eğitim durumu, annenin çalışma durumu, babanın çalışma durumu, algılanan maddi gelir düzey, günlük ortalama ders çalışma süresi, günlük ortalama internet kullanım süresi, günlük ortalama televizyon izleme süresi, eğitim hayatında sınıf tekrarı yapmış olma durumu, yükseköğretime devam etme isteği, örnek aldığı bir rol modelin varlığı, anne ile ilişki düzeyi, baba ile ilişki düzeyi vb.) ile kaygı, tükenme, akademik güdülenme, iletişimde olduğu öğretmenlerin depresyon düzeyi gibi faktörler ele alınmıştır. Bu faktörlere ek olarak okul idaresi aracılığıyla öğrencinin yılsonu başarı ortalaması ve devamsızlık bilgisi de ele alınmıştır. İfade edilen faktörlerin tespitinde araştırmacı tarafından geliştirilen bilgi formu, izinleri alınmış/satın alınmış ölçek ve envanterler kullanılmıştır. Araştırmada kullanılan veri seti, İstanbul il sınırlarında bulunan sosyo-demografik açısından farklılara sahip ilçelerdeki lise düzeyi okullardan derlenmiştir. 2371 öğrenciden derlenen veriler değerlendirilmiş, 887'si erkek ve 819'u kadın olmak üzere 1706 öğrencinin verisinin kullanılabilir olduğu anlaşılmıştır. Tez çalışması klasik eğitim ortamından derlenen verilere sınıflandırma teknikleri uygulanması açısından ülkemizde bir ilki temsil etmektedir. Bu nedenle araştırma boyunca gerek veri toplama sürecinde gerekse analizlerde birbirinden farklı pek çok sorun ile karşılaşılmıştır. Ancak başlangıç sorunu olması nedeniyle kritik öneme sahip olan“educational data mining”ifadesinin dilimize doğru bir biçimde çevrilmesidir. Doktora çalışmasına başlandığı süreçte kavramın karşılığının henüz literatüre girmemiş oluşu nedeniyle“eğitsel veri madenciliği, eğitimsel veri madenciliği ve eğitimde veri madenciliği”ifadelerinden hangisinin daha uygun olduğu, alanında uzman matematik eğitimcisi, dilbilimci ve veri madencileri ile görüşmeler yapılarak karara bağlanmıştır. Verilerin analizi ve sınıflandırma işlemlerinin gerçekleştirilmesinde CRISP-DM (Cross Industry Standard Process for Data Mining) süreci baz alınarak geliştirilen CRISP-EDM (Cross Industry Standard Process for Educational Data Mining) süreç modeli önerisi kullanılmıştır. Sınıflandırma tekniklerinden k-En Yakın Komşu Algoritması, Naive Bayes Sınıflandırıcı, C4.5 Karar Ağacı Algoritması, Logistik Regresyon Analizi ve Destek Vektör Makineleri kullanılarak farklı modeller oluşturulmuştur. Modellerin performansları tabakalı k-kat çapraz geçerleme ve hold out yöntemleri ile kontrol edilmiş, belirli kriterler ışığında kıyaslanmıştır. Modellerin oluşturulmasında araştırmacı, R dilinde kodlar yazmış ve yine bu dilde yazılmış hazır paketleri kullanmıştır. Kodların gerçekleştirilmesinde geliştirme aracı olarak RStudio ortamından yararlanılmıştır. Yapılan analizler sonucunda C4.5 Karar Ağacı Algoritmasının akademik başarının öngörülmesine ilişkin daha başarılı sonuçlar ürettiği anlaşılmıştır. Kurulan model, tezin topluma katkı sağlaması beklentisiyle Shiny paket ve shinyappsio aracılığyla web ortamına aktarılmıştır.
Özet (Çeviri)
Educational process has very important role on shaping future of society. Because of that role, the whole process with inputs, outputs and other elements should be frequently evaluated. In spite of macro and micro level achievement tests, the expected academic success can be accepted as controversial, because of the number of inputs, students in Turkey. So the prediction of academic success, in educational process, can give a crucial opportunity for prevansion and early intervention on the effect of factors. The general goal of thesis was based on predict how an output is formed as a meaning of success in the light of factors effect which included in literature during the process of the transforming student input to successful student in classic educational process. In order to build that prediction, the classification methods in data mining were used. The specific goal of that thesis based on predicting academic success of high school students in face to face educational environment by using some classification methods. The factors, effecting academic success, were specified via literature review. Those factors were socio-demographic variables (age, gender, educational status of mother, educational status of father, daily duration of studying, daily duration of TV watching, daily duration of internet surfing, grade repetition, wiling to continue for undergraduate, perceived relationship with parents, parental status and etc.), anxiety, exhaustion, academic motivation, and depression level of teachers. In addition to those factors, student's average of year-end school success and absenteeism were handled via school administration. In the determination of expressed factors, information form improved by researcher, gotten permissions/purchased scale and inventories were used. Data set used in the research, were collected from high-schools which have differences in terms of socio-demographic and settled in İstanbul provincial border. Compiled data with 2371 students were evaluated and only 1706 of them (887 male and 819 female) were used for data mining process.The Thesis has an importance because of applying the classification methods to data collected from classic education environment in our country. Therefore during the research, it was faced with many different problems about not only collecting data but also analysis. But in consequence of initial problem, the thing had critical importance was to be translated“educational data mining”in the correct way to our language. During to start doctorate study, as a consequence the term has not took part yet in our literature, it was arrived at a decision about which expression was more proper by meeting with expert math educator, linguist and data miner. In the data analysis and classification process actualization, CRISP-EDM (Cross Industry Standard Process for Educational Data Mining) which developed to base on CRISP-DM (Cross Industry Standard Process for Data Mining), process model was used. Different models were created by using classification techniques, such as K-Nearest Neighborhood, Naive Bayes Classifier, C 4.5 Decision Tree, Logistic Regression and Support Vector Machine. Performance of models, depend on choosing training and set sets, were controlled with k-fold cross validation and hold out methods and compared in the light of specific criteria. In the consist of models, researcher coded in R language and used R-packages. R studio was used for coding environment. As a result of conducted analysis, it was understood that decision tree algorithm produces more successful results which related predicting academic achievement. The model was transferred to web environment via Shiny package and shinyappsio in the expectation that thesis contributes to society.
Benzer Tezler
- Açıköğretim öğrencilerinin okul terkine etki eden faktörlerin veri madenciliği ile keşfi
Predicting the factors affecting school dropout in open and distance education students by using data mining
SELMA TOSUN
Doktora
Türkçe
2024
Eğitim ve ÖğretimGazi ÜniversitesiEğitim Bilimleri Ana Bilim Dalı
PROF. DR. DİLARA BAKAN KALAYCIOĞLU
- Akademik başarının eğitsel veri madenciliği ve makine öğrenmesi teknikleri kullanılarak tahminlenmesi
Predicting academic achievement using educational data mining and machine learning techniques
AYŞE ALKAN
Yüksek Lisans
Türkçe
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBurdur Mehmet Akif Ersoy ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. ONUR SEVLİ
- Web tabanlı eğitimde web madenciliği uygulaması ile öğrenci davranışlarının analizi
The analysis of students behaviour with web mining application in web based education
ORHAN ÜNLÜKAHRAMAN
Yüksek Lisans
Türkçe
2011
Eğitim ve ÖğretimFırat ÜniversitesiBilgisayar ve Öğretim Teknolojileri Eğitimi Ana Bilim Dalı
YRD. DOÇ. DR. TUNCAY SEVİNDİK
- Veri madenciliği sınıflandırma algoritmalarıyla lisans yabancı dil hazırlık programında öğrenmeyi etkileyen faktörlerin belirlenmesi
Determination of factors affecting learning in undergraduate foreign language preparatory program with data mining classification algorithms
İPEK ERDOĞMUŞ
Doktora
Türkçe
2023
Bilim ve Teknolojiİstanbul ÜniversitesiEnformatik Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ZERRİN AYVAZ REİS
- Predicting student academic performance using machine learning techniques
Makine öğrenme tekniklerini kullanarak öğrencinin akademik performansinin tahmin edilmesi
MIRWAIS DOOST
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAtılım ÜniversitesiYazılım Mühendisliği Ana Bilim Dalı
Assoc. Prof. Dr. CANSU ÇİĞDEM EKİN