Makine öğrenmesi yöntemleriyle demografik veriler üzerinden yabancı dil seviyesi tahmini
Prediction of foreign language proficiency via machine learning methods using demographic data
- Tez No: 857061
- Danışmanlar: PROF. DR. SELİN SONER KARA
- Tez Türü: Yüksek Lisans
- Konular: Endüstri ve Endüstri Mühendisliği, Industrial and Industrial Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2024
- Dil: Türkçe
- Üniversite: Yıldız Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Endüstri Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Sistem Mühendisliği Bilim Dalı
- Sayfa Sayısı: 64
Özet
Bu çalışmada Türkiye İstatistik Kurumu'ndan alınan Yetişkin Eğitimi Araştırması Mikro Veri Seti kullanılmıştır. Çalışmanın amacı bireylerin demografik verilerinin, yabancı dil bilgisinin tahmininde kullanılabileceğini paylaşmaktır. Çalışmaya literatür araştırması ile başlanmıştır. Ardından, veri setindeki tekil değişkenler ile hedef değişken olan yabancı dil seviyesi arasındaki ilişkiler incelenmiştir. Yer yer bağlantılar kurulabilmiş olsa da, çoğunlukla tekil incelemelerin yetersizliği öne çıkmıştır. Bu nedenle, bireylerin tüm bilgilerini sürece dahil edebilmek için makine öğrenmesi modellerinin kullanımına ihtiyaç doğmuştur. Öncelikle, veri seti makine öğrenmesi modellerinde kullanılabilir hale getirilmiştir. Varolan boş hücreler verisetinden kaldırılmıştır. Veride tahminlenecek sınıflar arasında dengesizlik tespit edilmiş olup, literatürde de sıkça kullanılan sentetik veri üretme yöntemi izlenerek bu dengesizlik giderilmiştir. Ardından tekil makine öğrenmesi ve topluluk öğrenmesi yöntemleri kullanılarak, değişkenler ve hedef değişken arasındaki ilişki kurulmuştur. Modellerin sonuçları doğruluk, kesinlik, F1 skoru gibi değerlendirme metrikleri ile karşılaştırılmış, ve en yüksek değeri veren modelin en başarılı olduğu kabul edilmiştir. Model başarı metrik değerleri oldukça yüksek olduğundan, çalışmanın bireylerin demografik verilerinin yabancı dil bilgisi ile ilişkili olduğu hipotezinin doğrulandığı söylenilebilir. Doğrulanmış hipotezden yola çıkılarak demografik veriler incelendiğinde, çalışmanın eğitim planlayıcılar için iyileştirme noktalarının tespiti açısından önemli bir kaynak olacağına inanılmaktadır.
Özet (Çeviri)
This study utilized the Micro Data Set from the Turkish Statistical Institute's Adult Education Survey. The aim of the study is to demonstrate the potential use of individuals' demographic data in predicting their proficiency in a foreign language. The study starts with a thorough literature review. Subsequently, the relationships between individual variables in the dataset and the target variable, which is the level of proficiency in a foreign language, were examined. Although connections were occasionally established, the insufficiency of singular examinations was evident. Consequently, there arose a necessity to incorporate all available information about individuals into the process, prompting the use of machine learning models. Initially, the dataset was prepared to be utilized in machine learning models. Empty cells within the dataset were removed. Imbalance among the classes to be predicted was detected, and this imbalance was eliminated by employing a synthetic data generation method commonly used in literature. Following this, machine learning and ensemble learning methods were employed to establish relationships between variables and the target variable. Model comparisons were made using evaluation metrics such as accuracy, precision, and F1 score. The model yielding the highest values in these performance metrics was deemed the most successful. Given the considerably high success metric values of the model, it can be asserted that the hypothesis stating a relationship between individuals' demographic data and proficiency in a foreign language has been confirmed. Building upon the confirmed hypothesis, when demographic data is examined, it is believed that this study will serve as a significant resource for identifying improvement areas for educational planners.
Benzer Tezler
- Exploring opinions of corporate instructional designers on their professional development and training needs
Kurumsal öğretim tasarımcılarının mesleki gelişim ve eğitim ihtiyaçları konusundaki görüşlerinin araştırılması
NAZLI GÖKALP
Yüksek Lisans
İngilizce
2025
Eğitim ve ÖğretimOrta Doğu Teknik ÜniversitesiEğitim Programları ve Öğretimi Ana Bilim Dalı
DR. ELİF ÖZTÜRK
- Uzaktan öğrenimde öğrenme analitiğinin biyometrik verilere göre değerlendirilmesi
Evaluation of learning analytics according to biometric data in distance learning
CEM TURAN
Doktora
Türkçe
2025
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul ÜniversitesiEnformatik Ana Bilim Dalı
PROF. DR. SEVİNÇ GÜLSEÇEN
DR. ÖĞR. ÜYESİ DURMUŞ KOÇ
- Derin öğrenme ve makine öğrenmesi yöntemleriyle Türkiye emlak piyasasında fiyat tahmini
Price prediction in the Turkish real estate market using deep learning and machine learning methods
RECEP FURKAN KOÇYİĞİT
Yüksek Lisans
Türkçe
2025
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolYıldız Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. BANU DİRİ
DR. AHMET ELBİR
- Comparative study of federated learning for credit risk assessment and fairness evaluation
Federe öğrenmenin karşılaştırmalı çalışması: Kredi risk değerlendirmesi ve adalet ölçümü
MUSTAFA AKTAŞ
Yüksek Lisans
İngilizce
2025
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Bilimleri Ana Bilim Dalı
PROF. DR. BEHÇET UĞUR TÖREYİN
DR. RUŞEN HALEPMOLLASI
- Erken dönem diyabet riskinin makine öğrenmesi ve istatistiksel yöntemlerle tahmini
Prediction of early-stage diabetes risk with machine learning and statistical techniques
YUSUF HALLAÇ
Yüksek Lisans
Türkçe
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolFırat Üniversitesiİstatistik Ana Bilim Dalı
PROF. DR. SİNAN ÇALIK