Makine öğrenmesi yöntemleriyle demografik veriler üzerinden yabancı dil seviyesi tahmini
Prediction of foreign language proficiency via machine learning methods using demographic data
- Tez No: 857061
- Danışmanlar: PROF. DR. SELİN SONER KARA
- Tez Türü: Yüksek Lisans
- Konular: Endüstri ve Endüstri Mühendisliği, Industrial and Industrial Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2024
- Dil: Türkçe
- Üniversite: Yıldız Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Endüstri Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Sistem Mühendisliği Bilim Dalı
- Sayfa Sayısı: 64
Özet
Bu çalışmada Türkiye İstatistik Kurumu'ndan alınan Yetişkin Eğitimi Araştırması Mikro Veri Seti kullanılmıştır. Çalışmanın amacı bireylerin demografik verilerinin, yabancı dil bilgisinin tahmininde kullanılabileceğini paylaşmaktır. Çalışmaya literatür araştırması ile başlanmıştır. Ardından, veri setindeki tekil değişkenler ile hedef değişken olan yabancı dil seviyesi arasındaki ilişkiler incelenmiştir. Yer yer bağlantılar kurulabilmiş olsa da, çoğunlukla tekil incelemelerin yetersizliği öne çıkmıştır. Bu nedenle, bireylerin tüm bilgilerini sürece dahil edebilmek için makine öğrenmesi modellerinin kullanımına ihtiyaç doğmuştur. Öncelikle, veri seti makine öğrenmesi modellerinde kullanılabilir hale getirilmiştir. Varolan boş hücreler verisetinden kaldırılmıştır. Veride tahminlenecek sınıflar arasında dengesizlik tespit edilmiş olup, literatürde de sıkça kullanılan sentetik veri üretme yöntemi izlenerek bu dengesizlik giderilmiştir. Ardından tekil makine öğrenmesi ve topluluk öğrenmesi yöntemleri kullanılarak, değişkenler ve hedef değişken arasındaki ilişki kurulmuştur. Modellerin sonuçları doğruluk, kesinlik, F1 skoru gibi değerlendirme metrikleri ile karşılaştırılmış, ve en yüksek değeri veren modelin en başarılı olduğu kabul edilmiştir. Model başarı metrik değerleri oldukça yüksek olduğundan, çalışmanın bireylerin demografik verilerinin yabancı dil bilgisi ile ilişkili olduğu hipotezinin doğrulandığı söylenilebilir. Doğrulanmış hipotezden yola çıkılarak demografik veriler incelendiğinde, çalışmanın eğitim planlayıcılar için iyileştirme noktalarının tespiti açısından önemli bir kaynak olacağına inanılmaktadır.
Özet (Çeviri)
This study utilized the Micro Data Set from the Turkish Statistical Institute's Adult Education Survey. The aim of the study is to demonstrate the potential use of individuals' demographic data in predicting their proficiency in a foreign language. The study starts with a thorough literature review. Subsequently, the relationships between individual variables in the dataset and the target variable, which is the level of proficiency in a foreign language, were examined. Although connections were occasionally established, the insufficiency of singular examinations was evident. Consequently, there arose a necessity to incorporate all available information about individuals into the process, prompting the use of machine learning models. Initially, the dataset was prepared to be utilized in machine learning models. Empty cells within the dataset were removed. Imbalance among the classes to be predicted was detected, and this imbalance was eliminated by employing a synthetic data generation method commonly used in literature. Following this, machine learning and ensemble learning methods were employed to establish relationships between variables and the target variable. Model comparisons were made using evaluation metrics such as accuracy, precision, and F1 score. The model yielding the highest values in these performance metrics was deemed the most successful. Given the considerably high success metric values of the model, it can be asserted that the hypothesis stating a relationship between individuals' demographic data and proficiency in a foreign language has been confirmed. Building upon the confirmed hypothesis, when demographic data is examined, it is believed that this study will serve as a significant resource for identifying improvement areas for educational planners.
Benzer Tezler
- Exploring opinions of corporate instructional designers on their professional development and training needs
Kurumsal öğretim tasarımcılarının mesleki gelişim ve eğitim ihtiyaçları konusundaki görüşlerinin araştırılması
NAZLI GÖKALP
Yüksek Lisans
İngilizce
2025
Eğitim ve ÖğretimOrta Doğu Teknik ÜniversitesiEğitim Programları ve Öğretimi Ana Bilim Dalı
DR. ELİF ÖZTÜRK
- Erken dönem diyabet riskinin makine öğrenmesi ve istatistiksel yöntemlerle tahmini
Prediction of early-stage diabetes risk with machine learning and statistical techniques
YUSUF HALLAÇ
Yüksek Lisans
Türkçe
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolFırat Üniversitesiİstatistik Ana Bilim Dalı
PROF. DR. SİNAN ÇALIK
- Derin öğrenme ile giyilebilir sensör tabanlı insan aktivitesi ve demografik grup tanıma
Wearable sensor-based human activity and demographic group recognition with deep learning
MEHMET ÇAĞDAŞ SAYGILI
Yüksek Lisans
Türkçe
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBaşkent ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. MUSTAFA SERT
- Lise son sınıf öğrencilerinde bağlanma biçimi ile karar verme stratejileri arasındaki ilişkinin incelenmesi
Investigation of the relationship between attachment format and decision-making strategies in high school senior students
EMİNE ÖZDEMİR
Yüksek Lisans
Türkçe
2019
PsikolojiÜsküdar ÜniversitesiKlinik Psikoloji Ana Bilim Dalı
DOÇ. DR. EYLEM ÖZTEN
- Farklı kültürlerden öğrenenler için uzaktan ders tasarım ilkelerinin belirlenmesi: Anadolu Üniversitesi Azerbaycan programları üzerine bir inceleme
Distance course design principles for culturally diverse learners: A research on Anadolu University's Azerbaijan programs
GÜLTEN KARTAL
Yüksek Lisans
Türkçe
2017
Eğitim ve ÖğretimAnadolu ÜniversitesiUzaktan Eğitim Ana Bilim Dalı
DOÇ. DR. ELİF TOPRAK
DOÇ. DR. EVRİM GENÇ KUMTEPE