Öğrenci başarısını kestirmede makine öğrenme algoritmalarına dayalı yeni bir sınıflandırma modeli
A new classification model based on machine learning algorithms to predict student success
- Tez No: 743731
- Danışmanlar: DOÇ. DR. BİLAL BARIŞ ALKAN
- Tez Türü: Yüksek Lisans
- Konular: Eğitim ve Öğretim, Education and Training
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2022
- Dil: Türkçe
- Üniversite: Akdeniz Üniversitesi
- Enstitü: Eğitim Bilimleri Enstitüsü
- Ana Bilim Dalı: Eğitim Bilimleri Ana Bilim Dalı
- Bilim Dalı: Eğitimde Ölçme ve Değerlendirme Bilim Dalı
- Sayfa Sayısı: 94
Özet
Günümüzde büyük veri yığınlarından önemli bilgilerin ortaya çıkarılması için kullanılan veriden öğrenme temelli makine öğrenme algoritmalarının kullanımı artmaktadır. Makine öğrenme algoritmalarının kullanıldığı en önemli alanlardan birisi de eğitimdir. Modern eğitim sistemi anlayışına sahip olan ülkeler, eğitim alanında elde edilen verilerden yola çıkarak geleceğe yönelik planlamalar yaparken süreç içerisinde yer alan eksiklikleri de belirlemektedir. Bu çalışmada, öncelikle öğrencilerin sınav başarısını etkileyen değişkenler üzerine bir araştırma yapılmıştır. Öğrenci başarısına etki eden değişkenler belirlendikten sonra, bu değişkenler üzerinden bir madde havuzu oluşturulmuştur. Oluşturulan bu madde havuzu uzman görüşü ve ön uygulamaların ardından son halini alarak 84 maddeye düşürülmüştür. Antalya merkez ilçelerinde yer alan okullardan Liselere Giriş Sınav (LGS) puanı ile öğrenci alan okullara kayıtlı olan öğrenciler başarılı, sadece not ortalamasıyla kayıt olunan okullara devam eden öğrenciler başarısız olarak adlandırılmıştır. Toplamda 363 başarısız, 250 başarılı öğrenci olmak üzere 613 öğrenciden COVİD-19 nedeniyle çevrimiçi anket yoluyla veriler toplanmıştır. Toplanan verilerle analiz kısmına geçilmiştir. Öncelikle maddelerden önem derecesi yüksek olan maddeler belirlenmiş, en yüksek önem derecesine sahip 30 maddeye verilen cevaplar üzerinden araştırmaya devam edilmiştir.“Öğrenciye ait kitap sayısı”,“öğrencinin sosyo-ekonomik durumu”,“ailenin okul etkinliklerine katılımı”gibi maddelerin öğrenci başarısında yüksek önem derecesine sahip olduğu görülmüştür. Çalışma kapsamında elde edilen veriler kategorik veriler olduğu için literatürde yapılan çalışmalar incelendiğinde, genelde kategorik verilerle daha iyi çalıştığı görülen C5.0, CART, DVM ve Rastgele Ormanlar algoritmaları verilerin analizinde kullanılmıştır. Veri seti eğitim (%80) ve test (%20) seti olmak üzere ikiye ayrılmıştır. Analizin hatalardan arınma oranını artırmak için tüm algoritmalar için çapraz doğrulama uygulanmıştır. Elde edilen model değerlendirme ölçütlerine göre Rastgele Ormanlar Algoritmasının en başarılı tahmini yapan algoritma olduğu görülmüştür. Rastgele ormanlar algoritması üzerinden sınıflandırıcı modeli için model katsayılarının tahminleri belirlenmiştir. Bu yeni sınıflandırıcı modeli üzerinden, sürece sonradan dahil olacak olan öğrenci için başarı durumunu sınıflandırması yapılacaktır. Elde edilen bu yeni sınıflandırıcı modelinin kullanımı sadece LGS sınavına hazırlanan öğrencilerin nitelikli bir okula yerleşip yerleşmemesi değil, aynı zamanda eğitim dönemi içerisinde öğrencilerin eksikliklerinin erken dönemde tespit edilerek bu eksikliklerin giderilebileceği ve başarı anlamında olumlu yönde katkı sağlanacağı düşünülmektedir.
Özet (Çeviri)
Today, the use of data-based machine learning algorithms, which are used to reveal important information from large data piles, is increasing. One of the most important areas in which machine learning algorithms are used is education. Countries with the understanding of modern education system determine the deficiencies in the process while making plans for the future based on the data obtained in the field of education. In this study, first of all, a research was conducted on the variables that affect students' exam success. After determining the variables affecting student success, an item pool was created based on these variables. This item pool was finalized after expert opinion and preliminary practices, and was reduced to 84 items. Students enrolled in schools in the central districts of Antalya that accept students with the High School Entrance Examination (LGS) score are considered successful, while students who attend schools with only a grade point average are considered unsuccessful. Data were collected from 613 students, 363 unsuccessful and 250 successful students, through an online survey due to COVID-19. The analysis part was started with the collected data. First of all, the items with a high degree of importance were determined, and the research continued on the answers given to the 30 items with the highest degree of importance. Items such as“the number of books belonging to the student”,“the socio-economic status of the student”,“the participation of the family in school activities”have a high degree of importance in student success. Since the data obtained within the scope of the study are categorical data, when the studies in the literature are examined, C5.0, CART, SVM and Random Forests algorithms, which are seen to work better with categorical data, were used in the analysis of the data. The data set is divided into two as training (80%) and test (20%) sets. Cross validation was applied for all algorithms to increase the error-free rate of the analysis. According to the model evaluation criteria obtained, the Random Forests Algorithm was found to be the most successful estimation algorithm. The estimations of the model coefficients for the classifier model were determined through the random forests algorithm. Through this new classifier model, the classification of success will be made for the student who will be involved in the process later. It is thought that the use of this new classifier model obtained is not only whether the students preparing for the LGS exam will be placed in a qualified school, but also that the deficiencies of the students can be detected early in the education period, these deficiencies can be eliminated and a positive contribution will be made in terms of success.
Benzer Tezler
- Lise birinci sınıf öğrencilerinin matematik, fizik ve kimya derslerindeki akademik başarılarının kestirilmesi
Başlık çevirisi yok
KEMAL DURUHAN
Yüksek Lisans
Türkçe
1988
Eğitim ve Öğretimİnönü ÜniversitesiEğitim Bilimleri Ana Bilim Dalı
DOÇ. DR. LÜTFİ ÖZBİLGİN
- Öğrenci akademik performansının kestirilmesine ilişkin bir model önerisi: Veri madenciliğine dayalı bir çalışma
Model proposal related to predicting student academic performance: A study based on data mining
MURAT ALTUN
Doktora
Türkçe
2019
Eğitim ve ÖğretimAkdeniz ÜniversitesiEğitim Bilimleri Ana Bilim Dalı
DOÇ. DR. KEMAL KAYIKÇI
- Sınav kaygısının öğrenci seçme sınavı başarısı ile ilişkisi
Başlık çevirisi yok
SERDAR ERKAN
Doktora
Türkçe
1991
Eğitim ve ÖğretimAnkara ÜniversitesiEğitimde Psikolojik Hizmetler Ana Bilim Dalı
PROF. DR. YILDIZ KUZGUN
- Çukurova Üniversitesi Eğitim Fakültesi Adana ve Hatay Eğitim Yüksekokullarındaki öğrencilerin 1987 ÖSS puanları ile akademik başarılarının karşılaştırılması
Başlık çevirisi yok
KEZBAN KURAN
Doktora
Türkçe
1988
Eğitim ve ÖğretimÇukurova ÜniversitesiEğitim Bilimleri Ana Bilim Dalı
PROF. DR. DOĞAN ÇAĞLAR
- İlköğretim 8. sınıf fizik dersi programının Kırgızistan ve Türkiye eğitim sistemlerinde karşılaştırmalı olarak incelenmesi
Сравнитель ный анализ учебных планов по предмету физика для 8-х классов вкыргызской и турецкой образовательных системах
GÜRKAN AKBABA
Yüksek Lisans
Türkçe
2011
Eğitim ve ÖğretimKırgızistan-Türkiye Manas ÜniversitesiEğitim Bilimleri Ana Bilim Dalı
DR. KADİYA BOOBEKOVA