Makina öğrenim algoritmaları ile İngilizce metin zorluk seviyelerinin sınıflandırılması: Bir yazılım önerisi

Classification of English texts' difficulty levels through machine learning algorithms: A program recommendation

PDF İndir

Tez No: 812595
Yazar: SOMAYYEH SHABESTANI
Danışmanlar: DOÇ. DR. MERVE GEÇİKLİ
Tez Türü: Yüksek Lisans
Konular: Eğitim ve Öğretim, Education and Training
Anahtar Kelimeler: Belirtilmemiş.
Yıl: 2023
Dil: İngilizce
Üniversite: Atatürk Üniversitesi
Enstitü: Eğitim Bilimleri Enstitüsü
Ana Bilim Dalı: İngiliz Dili Eğitimi Ana Bilim Dalı
Bilim Dalı: İngilizce Eğitimi Bilim Dalı
Sayfa Sayısı: 82

Özet

Amaç: Bu çalışmanın amacı, YDS okuduğunu anlama metinleri üzerinde alan uzmanları tarafından geleneksel formüllerle geliştirilen grid aracılığıyla yapılan metin sınıflandırma puanlaması ile önemli parametrelere dayanan modern yaklaşımlardan biri olan makine öğrenmesi algoritmaları kullanılarak yapılan metin sınıflandırma puanlamasını karşılaştırmaktır. Bu bağlamda çalışma, makine öğrenim algoritmalarının metin sınıflandırmasında kullanımının ölçme ve değerlendirme için metin okunabilirlik/zorluk düzeylerinin tespitinde kullanımına yönelik değerlendirilmesine dayanmaktadır. Yöntem: Çalışma, alan uzmanları tarafından aynı örneklem (YDS okuduğunu anlama metinleri) üzerinden okunabilirlik formüllerine dayalı grid yoluyla yapılan metin sınıflandırma puanlaması ile modern yaklaşımlardan makine öğrenim algoritmaları kullanılarak yapılan metin sınıflandırma puanlamasının karşılaştırıldığı karşılaştırmaya dayalı nicel bir çalışmadır. Bulgular: Gunning FOG Readability testi, Linsear Write, Flesch-Kincaid Grade Level, SMOG Index, Coleman-Liau, Dale-Chall-Readability, McAlpine EFLAW Readability ve Automated Readability Index olmak üzere sekiz okunabilirlik formülü kullanılarak YDS sınavlarından dokuz okuma-anlama metni okunabilirlik sınıflandırması için seçildi. Alan uzmanlarının kullandığı okunabilirlik formüllerine dayalı grid ile yapılan puanlama sonuçları, çalışmada kullanılan makine öğrenim algoritmeleri temelli analiz yapan programın puanlama sonuçları ile istatistiksel olarak anlamlı farklılık göstermiştir. Ayrıca, makine öğrenimi algoritmasına dayalı program tarafından okunabilirlik sınıflandırmasının güvenilirlik puanı katsayısı oldukça yüksekken, alan uzmanlarının puanlamasının da güvenilir olmadığı da tespit edilmiştir Sonuç: Sonuçlar, makine öğrenmesi algoritmalarına dayalı program ile metinleri güvenilir bir şekilde sınıflandırırken, alan uzmanlarının metinlerin okunabilirlik sınıflandırmasına ilişkin verdiği cevaplarda daha fazla hata olduğunu göstermiştir. Bu nedenle, bu çalışmada kullanılan programın, yabancı dil eğitimi alanındaki paydaşları tarafından (İngilizce öğretmenleri, ölçme ve değerlendirme uzmanları vb.) dil öğrenenlerin seviyelerine göre okuduğunu anlama metinlerinin seçiminde kullanılması önerilebilir.

Özet (Çeviri)

Purpose: The aim of this study is to compare the text classification scoring made by field experts with the grid developed with traditional formulas on YDS reading-comprehension texts and the text classification scoring made using machine learning algorithms, which is one of the modern approaches over important parameters and with this scoring comparison. Accordingly, the study is based on to evaluate the use of machine learning algorithms in text classification according to the readability/difficulty level for measurement and evaluation. Method: The study is a comparison based quantitative study in which the text classification scoring made by field experts through readability formulas based grid on the same sample (YDS reading-comprehension texts) was compared with the text classification scoring made using machine learning algorithms from modern approaches. Findings: Using eight readability formulas: Gunning FOG Readability test, Linsear Write, Flesch-Kincaid Grade Level, SMOG Index, Coleman-Liau, Dale-Chall-Readability, McAlpine EFLAW Readability, and Automated Readability Index, nine reading comprehension texts were selected from YDS exams for their readability assessment. In the study, the scores of the readability formulas based grid used by field experts differ statistically significantly from the scores of the programme used in the study, which is based on machine learning algorithms. The reliability score of readability classification by the program based on machnine learning algorithms is quite high while the scoring by the field experts is not realiable. Conclusion : The results indicated that, with the programme based on machine learning algorithms classified the texts in a reliable manner while there were more errors in the answers provided by field experts regarding texts readability classsfication. Therefore, the programme used in this study might be recommended for stakeholders (English teachers, assesment and testing experts etc.) in ELT to use in the choice of the reading comprehension texts to the levels of language learners.

Benzer Tezler

Tez No
847173
Fake news classification using machine learning and deep learning approaches
Makine öğrenimi ve derin öğrenme yaklaşımlarını kullanarak sahte haber sınıflandırması
SAJA ABDULHALEEM MAHMOOD AL-OBAIDI
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol Gazi Üniversitesi
Bilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ TUBA ÇAĞLIKANTAR
Tez No
747451
An investigation of the impact of different data cleaning techniques on metric result quality in machine learning
Makine öğrenmesinde, farklı veri temizleme tekniklerlerinin sonuç ölçevleri üzerindeki etkisinin incelenmesi
ISRAA MUSTAFA ABBAS
Yüksek Lisans
İngilizce
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol Atılım Üniversitesi
Yazılım Mühendisliği Ana Bilim Dalı
DOÇ. DR. SACİP TOKER
Tez No
952982
Discovering market insights from online product reviews through sentiment analysis
Çevrimiçi müşteri yorumları ile duygu analizi ve pazar payı için bir içgörü aracı
MUHAMMET ALİ KADIOĞLU
Yüksek Lisans
İngilizce
2022
Endüstri ve Endüstri Mühendisliği İstanbul Teknik Üniversitesi
Endüstri Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ERKAN IŞIKLI
Tez No
920848
Fake detection and analysis in tweets with machine learning algorithms
Makine öğrenimi algoritmaları ile tweetlerde sahtelik tespit ve analizi
ŞEHRİNAZ KOCA
Yüksek Lisans
İngilizce
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol Hacettepe Üniversitesi
Bilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. İLYAS ÇİÇEKLİ
Tez No
909526
The evaluation of heuristic optimization techniques on text categorization with conventional machine learning algorithms and deep learning methodologies
Metin kategorizasyonunda geleneksel makine öğrenimi algoritmaları ve derin öğrenme yöntemleri ile sezgisel optimizasyon tekniklerinin değerlendirilmesi
CEM KAYA
Doktora
İngilizce
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol Doğuş Üniversitesi
Bilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. MİTAT UYSAL
DOÇ. DR. ZEYNEP HİLAL KİLİMCİ

Geri Dön