Türkçe doğal dil işleme araçlarının ilk ve ortaokul fen bilimleri ders kitapları analizinde kullanımı: Sözcük ve sözcük kökü frekanslarının karşılaştırmalı analizi
Using Turkish natural language processing tools in analysis of science textbooks for primary and secondary education: Comparative analysis of word and lemma frequencies
- Tez No: 778377
- Danışmanlar: DOÇ. DR. AHMET YAVUZ
- Tez Türü: Yüksek Lisans
- Konular: Eğitim ve Öğretim, Education and Training
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2023
- Dil: Türkçe
- Üniversite: Niğde Ömer Halisdemir Üniversitesi
- Enstitü: Eğitim Bilimleri Enstitüsü
- Ana Bilim Dalı: Matematik ve Fen Bilimleri Eğitimi Ana Bilim Dalı
- Bilim Dalı: Fen Bilgisi Eğitimi Bilim Dalı
- Sayfa Sayısı: 158
Özet
Bu tez çalışmasının amacı, ilkokul ile ortaokul sınıf düzeylerinde okutulan Fen Bilimleri ders kitaplarını doğal dil işleme araçları yöntemleriyle otomatik olarak analiz edilmesine dayanmaktadır. Nicel araştırma yönteminin kullanıldığı bu çalışmada doküman analizi kullanılmıştır. Milli Eğitim Bakanlığı Eğitim Bilişim Ağı'nda 2020-2021 Eğitim-Öğretim yılı için yayınlanmış olan PDF formatındaki her sınıf düzeyinden iki Fen Bilimleri ders kitabı örneklemi olmuştur. Üniteler PDF formatından Microsoft Word belgesi ardından düz metin belgesine dönüştürülmüştür. NKod yazılımı yardımıyla sözcük frekans listeleri elde edilmiş olan üniteler RStudio programı yardımıyla R programlama dilinde uygun kütüphaneler ve gerekli kodlamalarla, otomatik metin analizi yapılarak karşılaştırılmıştır. Metinlerdeki 134915 sözcük ve 19363 isim kökü ile çalışılmıştır. Yapılan analizlerde ilk olarak ders kitaplarının sözcük frekans listelerinin ilk 20 sözcüğünün sınıflandırılmış ve ünitelerin içeriğini yordamaya yardımcı olduğu sonucuna varılmıştır. İkinci olarak elde edilen sözcük frekans listeleri normal dağılıma uymadığından üniteler arasındaki korelasyonlar için Spearman Sıra Korelasyonu Testi uygulanmıştır. Analizler farklı kitapların aynı üniteleri arasında güçlü ve orta kuvvette ilişki (0.3≤𝜌≤0.5), farklı üniteleri arasında ise düşük kuvvette ilişki (𝜌3.84 𝑣𝑒 𝑝
Özet (Çeviri)
The aim of this thesis is based on the automatic analysis of science textbooks taught at primary and secondary school grade levels using natural language processing tools. Document analysis was used in this study in which quantitative research method was used. Two Science textbooks from each grade level in PDF format published in the Ministry of National Education Information Network for the 2020-2021 academic year were sampled. The units were converted from PDF format to Microsoft Word document and then to the plain text. The units, whose word frequency lists were obtained with the help of NKod software, were compared with the help of RStudio program by performing automatic text analysis with appropriate libraries and necessary coding in R programming language. 134915 words and 19363 noun stems in the texts were studied. In the analysis, firstly, it was concluded that the first 20 words of the word frequency lists of the textbooks were classified and helped to predict the content of the units. Secondly, since the word frequency lists obtained did not fit the normal distribution, the Spearman Rank Correlation Test was performed for the correlations between the units. The analyses revealed strong and moderate correlations between the same units of different books (0.3≤𝜌≤0.5), and a low-strength relationship between different units (𝜌3.84 𝑎𝑛𝑑 𝑝
Benzer Tezler
- Struktur und gestaltung der ausbildung turkischer Deutschlehrerstudierenden im fach methodik
Alman dili eğitiminde konu ve yapı olarak yöntembilim dersi
GÜLTEN GÜLER
- Deep learning-based preprocessing tools for Turkish natural language processing
Türkçe doğal dil işleme için derin öğrenme tabanlı ön işleme araçları
BUSE AK
Yüksek Lisans
İngilizce
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. TUNGA GÜNGÖR
- Текст тапшырмаларын баалоо моделин иштеп чыгуу
Metin ödevlerin değerlendirme modelinin geliştirilmesi
IRISKÜL SAPARALİEVA
Yüksek Lisans
Kırgızca
2022
Doğu Dilleri ve EdebiyatıKırgızistan-Türkiye Manas ÜniversitesiDOÇ. DR. RİTA İSMAİLOVA
- Building of Turkish propbank and semantic role labeling of Turkish
Türkçe önerme veri tabanının oluşturulması ve Türkçenin anlamsal görev çözümlemesi
GÖZDE GÜL ŞAHİN
Doktora
İngilizce
2018
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. EŞREF ADALI
- Deep learning-based dependency parsing for Turkish
Derin öğrenme tabanlı Türkçe bağlılık ayrıştırması
ŞAZİYE BETÜL ÖZATEŞ
Doktora
İngilizce
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. ARZUCAN ÖZGÜR TÜRKMEN
PROF. DR. TUNGA GÜNGÖR