Geri Dön

Developing a new approach in natural language understanding to detect defective expressions for turkish

Türkçe için doğal dil anlamada anlatım bozukluklarının tespiti için yeni bir yaklaşım geliştirilmesi

  1. Tez No: 751801
  2. Yazar: ATİLLA SUNCAK
  3. Danışmanlar: DR. ÖĞR. ÜYESİ ÖZLEM AKTAŞ
  4. Tez Türü: Doktora
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2022
  8. Dil: İngilizce
  9. Üniversite: Dokuz Eylül Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
  13. Sayfa Sayısı: 82

Özet

Anlatım bozukluğu, Türkçe cümlelerdeki anlamsal ve biçimsel belirsizlikleri ifade eden dil bilgisel bir terimdir. Genelde cümledeki özne, yüklem, nesne gibi ögelerin gereksiz kullanımından veya hiç kullanılmamasından ya da eklerin yanlış kullanımından kaynaklanırlar. Literatürdeki çeşitli çalışmalar incelendiğinde, bu konu ile alakalı çoğunlukla dilbilimcilerin gerçekleştirdiği öğrenci anketleri ve kompozisyon analizleri ya da araştırmacıların yaptığı manuel analizler ortaya çıkmaktadır. Konu ile alakalı doğal dil işleme çalışmalarının olmaması, bizi bu konuyu bilgisayar teknolojileri kullanarak analiz etmeye yöneltmiştir. Ancak, Türkçe gibi dil bilgisel anlamda zorlu diller, özellikle anlamsal problemlerde kural tabanlı ve dile özgü çözümler gerektirir. Kural tabanlı sistemlerin ise işlem sırasındaki etkinliği, geliştirme sırasındaki zaman tüketimi ve dildeki değişime karşı adaptasyon problemleri gibi büyük engelleri mevcuttur. Makine öğrenmesi modelleri, son yıllarda büyük gelişmeler göstermiştir, bu gelişmeler ise doğal dil işleme uygulamalarında eşi görülmemiş bir performans artışı sağlamıştır. Bu tezde, anlatım bozukluklarının tespitinde derin öğrenme modellerinden LSTM ve CNN; makine öğrenmesi sınıflandırıcılarından da KNN, SVM ve RF modelleri önerilmiştir. Deneysel çalışmalar, derin öğrenme yaklaşımlarının, anlatım bozukluğu tespitinde makine öğrenmesi sınıflandırıcılarına göre daha ön plana çıktığını göstermektedir. Ayrıca bu çalışma, veri seti artırıldığında ve daha uygun hale getirildiği takdirde, uzun dönem bağımlılıklarının da öğrenme kabiliyetine sahip olduğundan LSTM mimarisinin daha iyi sonuçlar verebileceğini yansıtmaktadır. Tezin, bu alanda yapılan orijinal bir çalışma olması, Türkçe doğal dil işlemeye büyük bir katkı sağlayacak ve alanda çalışma yapan diğer araştırmacılara da iyi bir kaynak olacağı düşünülmektedir.

Özet (Çeviri)

Defective expression is a grammatical term that refers both semantic and morphologic ambiguities in Turkish sentences. They are generally caused by misusing of a suffix in addition to absence or unnecessary use of an element in a sentence such as object, subject and etc. Having analyzed several studies related to this issue, it is found out that they are mostly performed by linguists by means of student questionnaires, tests or manual analysis by researchers. The absence of Natural Language Processing (NLP) studies related to this issue directed us to deal with this subject using computer technologies. However, grammatically demanding languages such as Turkish generally require rule-based and language-specific solutions especially in semantic problems. Rule-based systems have some major obstacles such as efficiency in processing, time consumption while development and intolerance for alteration in language. Machine learning models have made great advances in recent years, which led to unprecedented boost in NLP applications in terms of performance. In this thesis, we propose deep learning models of Long Short-Term Memory (LSTM) and Convolutional Neural Network (CNN) in addition to machine learning classifiers of k-Nearest Neighbor (KNN), Support Vector Machine (SVM) and Random Forest (RF) to detect defective expressions in Turkish sentences. Experimental trials show that deep neural approaches come into prominence for detection in comparison to traditional classifiers. The study also reflects that due to having learning capability of long term dependencies, LSTM architecture will provide more promising results when amount of dataset is increased and more optimized. By being an original study in this field, this study is considered to make a great contribution to Turkish NLP and provides an excellent source for other researchers studying this area.

Benzer Tezler

  1. Dijital asistanlar için melez sınıflandırıcı: ontoloji tabanlı çoklu alanlı niyet havuzu yöntemi

    Hybrid classifier for digital assistants: ontology-based multi-domain intent pooling method

    ENES BULUT

    Doktora

    Türkçe

    Türkçe

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolEge Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. MURAT OSMAN ÜNALIR

  2. Next-generation cell type annotation: Integrating NLP and ML techniques for enhanced scRNA classification

    Yeni nesil hücre tipi anotasyonu: Geliştirilmiş scRNA sınıflandırması için NLP ve ML tekniklerinin entegrasyonu

    ORÇUN SAMİ TANDOĞAN

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    BiyoteknolojiOrta Doğu Teknik Üniversitesi

    Biyoteknoloji Ana Bilim Dalı

    YRD. DOÇ. DR. AYBAR CAN ACAR

    DOÇ. DR. CAN ÖZEN

  3. The significance and the contribution of 6+1 traits of writing to the success of the students in writing courses in English language teaching

    Yazmanın 6+1 özelliğinin İngilizce öğretiminde yazılı anlatım derslerindeki öğrenci başarısına katkısı ve önemi

    ÖZLEM YAZAR

    Yüksek Lisans

    İngilizce

    İngilizce

    2004

    Eğitim ve ÖğretimGazi Üniversitesi

    İngiliz Dili Eğitimi Ana Bilim Dalı

    YRD. DOÇ. DR. PAŞA TEVFİK CEPHE

  4. Children participation and post occupancy evaluation in developing a communicative language to (re)design educational environments

    Eğitim ortamlarının (yeniden) tasarımı için bir iletişim dili geliştirilmesinde kullanım sonrası değerlendirme ve çocukların katılımı

    ODETA MANAHASA

    Doktora

    İngilizce

    İngilizce

    2017

    Mimarlıkİstanbul Teknik Üniversitesi

    Mimarlık Ana Bilim Dalı

    PROF. DR. FATMA AHSEN ÖZSOY