Makina öğrenim algoritmaları ile İngilizce metin zorluk seviyelerinin sınıflandırılması: Bir yazılım önerisi
Classification of English texts' difficulty levels through machine learning algorithms: A program recommendation
- Tez No: 812595
- Danışmanlar: DOÇ. DR. MERVE GEÇİKLİ
- Tez Türü: Yüksek Lisans
- Konular: Eğitim ve Öğretim, Education and Training
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2023
- Dil: İngilizce
- Üniversite: Atatürk Üniversitesi
- Enstitü: Eğitim Bilimleri Enstitüsü
- Ana Bilim Dalı: İngiliz Dili Eğitimi Ana Bilim Dalı
- Bilim Dalı: İngilizce Eğitimi Bilim Dalı
- Sayfa Sayısı: 82
Özet
Amaç: Bu çalışmanın amacı, YDS okuduğunu anlama metinleri üzerinde alan uzmanları tarafından geleneksel formüllerle geliştirilen grid aracılığıyla yapılan metin sınıflandırma puanlaması ile önemli parametrelere dayanan modern yaklaşımlardan biri olan makine öğrenmesi algoritmaları kullanılarak yapılan metin sınıflandırma puanlamasını karşılaştırmaktır. Bu bağlamda çalışma, makine öğrenim algoritmalarının metin sınıflandırmasında kullanımının ölçme ve değerlendirme için metin okunabilirlik/zorluk düzeylerinin tespitinde kullanımına yönelik değerlendirilmesine dayanmaktadır. Yöntem: Çalışma, alan uzmanları tarafından aynı örneklem (YDS okuduğunu anlama metinleri) üzerinden okunabilirlik formüllerine dayalı grid yoluyla yapılan metin sınıflandırma puanlaması ile modern yaklaşımlardan makine öğrenim algoritmaları kullanılarak yapılan metin sınıflandırma puanlamasının karşılaştırıldığı karşılaştırmaya dayalı nicel bir çalışmadır. Bulgular: Gunning FOG Readability testi, Linsear Write, Flesch-Kincaid Grade Level, SMOG Index, Coleman-Liau, Dale-Chall-Readability, McAlpine EFLAW Readability ve Automated Readability Index olmak üzere sekiz okunabilirlik formülü kullanılarak YDS sınavlarından dokuz okuma-anlama metni okunabilirlik sınıflandırması için seçildi. Alan uzmanlarının kullandığı okunabilirlik formüllerine dayalı grid ile yapılan puanlama sonuçları, çalışmada kullanılan makine öğrenim algoritmeleri temelli analiz yapan programın puanlama sonuçları ile istatistiksel olarak anlamlı farklılık göstermiştir. Ayrıca, makine öğrenimi algoritmasına dayalı program tarafından okunabilirlik sınıflandırmasının güvenilirlik puanı katsayısı oldukça yüksekken, alan uzmanlarının puanlamasının da güvenilir olmadığı da tespit edilmiştir Sonuç: Sonuçlar, makine öğrenmesi algoritmalarına dayalı program ile metinleri güvenilir bir şekilde sınıflandırırken, alan uzmanlarının metinlerin okunabilirlik sınıflandırmasına ilişkin verdiği cevaplarda daha fazla hata olduğunu göstermiştir. Bu nedenle, bu çalışmada kullanılan programın, yabancı dil eğitimi alanındaki paydaşları tarafından (İngilizce öğretmenleri, ölçme ve değerlendirme uzmanları vb.) dil öğrenenlerin seviyelerine göre okuduğunu anlama metinlerinin seçiminde kullanılması önerilebilir.
Özet (Çeviri)
Purpose: The aim of this study is to compare the text classification scoring made by field experts with the grid developed with traditional formulas on YDS reading-comprehension texts and the text classification scoring made using machine learning algorithms, which is one of the modern approaches over important parameters and with this scoring comparison. Accordingly, the study is based on to evaluate the use of machine learning algorithms in text classification according to the readability/difficulty level for measurement and evaluation. Method: The study is a comparison based quantitative study in which the text classification scoring made by field experts through readability formulas based grid on the same sample (YDS reading-comprehension texts) was compared with the text classification scoring made using machine learning algorithms from modern approaches. Findings: Using eight readability formulas: Gunning FOG Readability test, Linsear Write, Flesch-Kincaid Grade Level, SMOG Index, Coleman-Liau, Dale-Chall-Readability, McAlpine EFLAW Readability, and Automated Readability Index, nine reading comprehension texts were selected from YDS exams for their readability assessment. In the study, the scores of the readability formulas based grid used by field experts differ statistically significantly from the scores of the programme used in the study, which is based on machine learning algorithms. The reliability score of readability classification by the program based on machnine learning algorithms is quite high while the scoring by the field experts is not realiable. Conclusion : The results indicated that, with the programme based on machine learning algorithms classified the texts in a reliable manner while there were more errors in the answers provided by field experts regarding texts readability classsfication. Therefore, the programme used in this study might be recommended for stakeholders (English teachers, assesment and testing experts etc.) in ELT to use in the choice of the reading comprehension texts to the levels of language learners.
Benzer Tezler
- Fake news classification using machine learning and deep learning approaches
Makine öğrenimi ve derin öğrenme yaklaşımlarını kullanarak sahte haber sınıflandırması
SAJA ABDULHALEEM MAHMOOD AL-OBAIDI
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ TUBA ÇAĞLIKANTAR
- An investigation of the impact of different data cleaning techniques on metric result quality in machine learning
Makine öğrenmesinde, farklı veri temizleme tekniklerlerinin sonuç ölçevleri üzerindeki etkisinin incelenmesi
ISRAA MUSTAFA ABBAS
Yüksek Lisans
İngilizce
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAtılım ÜniversitesiYazılım Mühendisliği Ana Bilim Dalı
DOÇ. DR. SACİP TOKER
- The evaluation of heuristic optimization techniques on text categorization with conventional machine learning algorithms and deep learning methodologies
Metin kategorizasyonunda geleneksel makine öğrenimi algoritmaları ve derin öğrenme yöntemleri ile sezgisel optimizasyon tekniklerinin değerlendirilmesi
CEM KAYA
Doktora
İngilizce
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolDoğuş ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. MİTAT UYSAL
DOÇ. DR. ZEYNEP HİLAL KİLİMCİ
- Text clustering and topic modeling on Covid-19 vaccine tweets using machine learning, natural language processing, and deep learning
Makine öğrenimi, doğal dil işleme ve derin öğrenme kullanılarak Covıd-19 aşısı tweetlerinde metin kümeleme ve konu modelleme
DAVID OKORE UKWEN
Yüksek Lisans
İngilizce
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolFırat ÜniversitesiYazılım Mühendisliği Ana Bilim Dalı
PROF. DR. MURAT KARABATAK
- Twitter sentiment analysis via machine learning
Makine öğrenimi yoluyla twitter duygu analizi
KEMAL MAHMUT KAŞGARLI
Yüksek Lisans
İngilizce
2021
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKadir Has ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. TANER ARSAN