Geri Dön

Türkçe öğrenici derlemi (TÖD): sözcük sıklığı ve yanlış çözümlemesi

Turkish learner corpus (TLC): Word frequency and error analysis

  1. Tez No: 782779
  2. Yazar: DEREM ÇANGA
  3. Danışmanlar: PROF. DR. DİLEK PEÇENEK
  4. Tez Türü: Doktora
  5. Konular: Dilbilim, Eğitim ve Öğretim, Linguistics, Education and Training
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2022
  8. Dil: Türkçe
  9. Üniversite: Ankara Üniversitesi
  10. Enstitü: Sosyal Bilimler Enstitüsü
  11. Ana Bilim Dalı: Dilbilim Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 285

Özet

Bu tez çalışmasında üç kurumda farklı düzeylerde ikinci dil olarak Türkçe öğrenen öğrenicilerin yazılı metinlerindeki sözvarlıkları, sözcük sıklıkları ve yanlışlarının ortaya çıkarılması amaçlanmıştır. Bu amaç doğrultusunda Ankara Üniversitesi TÖMER, İzmir Dokuz Eylül Üniversitesi DEDAM ve ODTÜ'de Avrupa OBM düzeyleri olan A1, A2, B1, B2, C1 ve C2 düzeylerinde öğrenim gören toplam 319 öğrenicinin ödev ve sınav metinleri toplanmış, bilgisayara aktarılarak sayısallaştırılmıştır ve böylece 94,739 sözcükten oluşan TÖD (Türkçe Öğrenici Derlemi) oluşturulmuştur. Daha sonra bu metinlerin hepsi AntConc yazılımına aktarılarak elde edilen sözcük listesi kullanılarak 4,072 başsözcükten oluşan bir başsözcük listesi oluşturulmuştur. Bu liste kullanılarak, öğrenicilerin yaş, cinsiyet, anadili, düzeyi gibi metin dışı bilgilerine göre oluşturulan alt derlemlerdeki başsözcük sıklıkları listelenmiş ve birbirleriyle karşılaştırılmıştır. Sonuçta yaş, cinsiyet, anadili ve Türkiye'de kalma süresi gibi değişkenlerin de sıklık listelerinde farklara sebep olabildiği görülmüş olsa da en büyük etmenin öğrenicilerin düzeyi ve metinlerin konusu olduğu sonucuna varılmıştır. Ayrıca, yanlışları 176 yanlış türüne ayıran bir yanlış sınıflandırması oluşturulmuş ve metinler ve metin dışı bilgilere ek olarak bu sınıflandırma da UAM yazılımına girilmiştir. Daha sonra tüm derlemdeki yanlışlar bu sınıflandırma doğrultusunda yazılımda işaretlenmiş, toplamda 19,992 yanlış saptanmıştır. Derlemde en fazla sayıda yapılan yanlışlar ortografik yanlışlar (%36.6), daha sonra sözdizimsel/biçimsözdizimsel yanlışlar (%31.7), daha sonra biçimsesbilimsel yanlışlar (%14.7) ve son olarak da sözlüksel yanlışlar (%13.2) olmuş, bunlar dışındaki yanlışlar diğer kategorisinde toplanmıştır. Sıklık listelerinde olduğu gibi, burada da yaş, cinsiyet, düzey, Türkiye'de kalma süresi gibi değişkenlere göre alt derlemler oluşturulmuş ve her birinde yapılan yanlışların sayısı ve türü karşılaştırılmıştır. Her değişkene göre oluşturulan gruplardaki her alt grubun diğerlerinden fazla sayıda yaptığı yanlış türleri saptanmış ve bu farklılıkların sebepleri açıklanmıştır.

Özet (Çeviri)

This thesis aims to reveal the vocabulary, word frequencies, and the errors made in the written texts composed by learners of Turkish as a foreign language at three different institutions at six different levels. For this aim, the written assignments and exam papers of 319 learners learning Turkish at Ankara University TÖMER, İzmir Dokuz Eylül University DEDAM and Middle East Technical University at CEFR levels A1, A2, B1, B2, C1 and C2 were collected and digitalized. In this way, a learner corpus of 94,739 words named TLC (Turkish Learner Corpus) was created. Then, all these texts were transferred to the AntConc software and using the word list that was provided, a lemma list of 4,702 words was constructed. Using this lemma list, the lemma frequencies were listed for each group that was created based on certain demographic criteria such as age, gender, native language, level and level. These lists were compared to one another and as a result, it was concluded that these factors such as age, gender, native language and the duration of stay in Turkey had some effects on the difference among the lists; however, the main factor causing these differences was the level the students were studying at and the prompts given in the assignments and exams. In addition to the word lists, an error classification scheme which branches into 176 error types was constructed and together with the learner texts and demographic information, this scheme was uploaded to the UAM software. On this software, all the errors were annotated based on the error scheme and 19,992 errors in total were detected. The error type that was made most frequently was orthographic errors (36.6%), followed by morpho-syntactic errors (31.7%), and morpho-phonological errors (14.7%) and finally word choice errors (13.2%). Other errors that did not fall into any of these categories were annotated as“other”. As done with the word frequency lists, these errors were also analyzed based on the demographic information of the learners. The number and type of errors made by each group of learners were compared. The types of errors made by each sub-group based on those criteria were detected and the reasons for the differences in those groups were analyzed.

Benzer Tezler

  1. A corpus-informed study based on a contrastive analysis of stance markers in learner English: From corpus to classroom

    Öğrenici İngilizcesinde tutum belirteçlerinin karşılaştırmalı analizine dayalı derlem temelli bir çalışma: Derlemden sınıfa

    ZEHRA SAVRAN

    Yüksek Lisans

    İngilizce

    İngilizce

    2017

    DilbilimFırat Üniversitesi

    İngiliz Dili ve Edebiyatı Ana Bilim Dalı

    YRD. DOÇ. DR. AYSEL ŞAHİN KIZIL

  2. Derlem tabanlı çevrim içi Türkçe öğrenci sözlüğü: Önadlar A madde başı

    Corpus based online learner dictionary: A headwords for adjectives

    BURAK TÜFEKÇİOĞLU

    Yüksek Lisans

    Türkçe

    Türkçe

    2013

    Eğitim ve ÖğretimMersin Üniversitesi

    Eğitim Bilimleri Ana Bilim Dalı

    YRD. DOÇ. DR. BÜLENT ÖZKAN

  3. A corpus-based semantic prosodic analysis of English intensifiers in native and non-native corpora with a special focus to their usage patterns and evaluative meanings

    İngilizce pekiştireçlerin kullanım şekilleri ve tutumsal anlamları üzerine yerli ve yabancı derlem tabanlı anlamsal bürün (Semantik prozodi) analizi

    NESLİHAN KELEŞ

    Yüksek Lisans

    İngilizce

    İngilizce

    2019

    DilbilimKaradeniz Teknik Üniversitesi

    Batı Dilleri ve Edebiyatları Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ALİ ŞÜKRÜ ÖZBAY

  4. Writer visibility and reader engagement in university students' argumentative essays

    Üniversite öğrencilerinin tartışmaya dayalı yazılı anlatımlarında yazar ve okuyucuyu görünür kılan öğeler

    DUYGU ÇANDARLI

    Yüksek Lisans

    İngilizce

    İngilizce

    2013

    Eğitim ve ÖğretimBoğaziçi Üniversitesi

    Yabancı Diller Eğitimi Ana Bilim Dalı

    PROF. DR. YASEMİN BAYYURT

    YRD. DOÇ. DR. LEYLA MARTI

  5. On the use of English reciprocal pronouns: An analysis of native and non-native student writing

    İngilizce' deki işteşlik adıllarının kullanımı üzerine: Anadil konuşurları ile anadili konuşuru olmayan öğrenci yazımlarının bir analizi

    CEMİLE BAHAR BALABAN

    Yüksek Lisans

    İngilizce

    İngilizce

    2014

    DilbilimÇukurova Üniversitesi

    İngiliz Dili Eğitimi Ana Bilim Dalı

    DOÇ. DR. CEM CAN