Developing a new approach in natural language understanding to detect defective expressions for turkish
Türkçe için doğal dil anlamada anlatım bozukluklarının tespiti için yeni bir yaklaşım geliştirilmesi
- Tez No: 751801
- Danışmanlar: DR. ÖĞR. ÜYESİ ÖZLEM AKTAŞ
- Tez Türü: Doktora
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2022
- Dil: İngilizce
- Üniversite: Dokuz Eylül Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
- Sayfa Sayısı: 82
Özet
Anlatım bozukluğu, Türkçe cümlelerdeki anlamsal ve biçimsel belirsizlikleri ifade eden dil bilgisel bir terimdir. Genelde cümledeki özne, yüklem, nesne gibi ögelerin gereksiz kullanımından veya hiç kullanılmamasından ya da eklerin yanlış kullanımından kaynaklanırlar. Literatürdeki çeşitli çalışmalar incelendiğinde, bu konu ile alakalı çoğunlukla dilbilimcilerin gerçekleştirdiği öğrenci anketleri ve kompozisyon analizleri ya da araştırmacıların yaptığı manuel analizler ortaya çıkmaktadır. Konu ile alakalı doğal dil işleme çalışmalarının olmaması, bizi bu konuyu bilgisayar teknolojileri kullanarak analiz etmeye yöneltmiştir. Ancak, Türkçe gibi dil bilgisel anlamda zorlu diller, özellikle anlamsal problemlerde kural tabanlı ve dile özgü çözümler gerektirir. Kural tabanlı sistemlerin ise işlem sırasındaki etkinliği, geliştirme sırasındaki zaman tüketimi ve dildeki değişime karşı adaptasyon problemleri gibi büyük engelleri mevcuttur. Makine öğrenmesi modelleri, son yıllarda büyük gelişmeler göstermiştir, bu gelişmeler ise doğal dil işleme uygulamalarında eşi görülmemiş bir performans artışı sağlamıştır. Bu tezde, anlatım bozukluklarının tespitinde derin öğrenme modellerinden LSTM ve CNN; makine öğrenmesi sınıflandırıcılarından da KNN, SVM ve RF modelleri önerilmiştir. Deneysel çalışmalar, derin öğrenme yaklaşımlarının, anlatım bozukluğu tespitinde makine öğrenmesi sınıflandırıcılarına göre daha ön plana çıktığını göstermektedir. Ayrıca bu çalışma, veri seti artırıldığında ve daha uygun hale getirildiği takdirde, uzun dönem bağımlılıklarının da öğrenme kabiliyetine sahip olduğundan LSTM mimarisinin daha iyi sonuçlar verebileceğini yansıtmaktadır. Tezin, bu alanda yapılan orijinal bir çalışma olması, Türkçe doğal dil işlemeye büyük bir katkı sağlayacak ve alanda çalışma yapan diğer araştırmacılara da iyi bir kaynak olacağı düşünülmektedir.
Özet (Çeviri)
Defective expression is a grammatical term that refers both semantic and morphologic ambiguities in Turkish sentences. They are generally caused by misusing of a suffix in addition to absence or unnecessary use of an element in a sentence such as object, subject and etc. Having analyzed several studies related to this issue, it is found out that they are mostly performed by linguists by means of student questionnaires, tests or manual analysis by researchers. The absence of Natural Language Processing (NLP) studies related to this issue directed us to deal with this subject using computer technologies. However, grammatically demanding languages such as Turkish generally require rule-based and language-specific solutions especially in semantic problems. Rule-based systems have some major obstacles such as efficiency in processing, time consumption while development and intolerance for alteration in language. Machine learning models have made great advances in recent years, which led to unprecedented boost in NLP applications in terms of performance. In this thesis, we propose deep learning models of Long Short-Term Memory (LSTM) and Convolutional Neural Network (CNN) in addition to machine learning classifiers of k-Nearest Neighbor (KNN), Support Vector Machine (SVM) and Random Forest (RF) to detect defective expressions in Turkish sentences. Experimental trials show that deep neural approaches come into prominence for detection in comparison to traditional classifiers. The study also reflects that due to having learning capability of long term dependencies, LSTM architecture will provide more promising results when amount of dataset is increased and more optimized. By being an original study in this field, this study is considered to make a great contribution to Turkish NLP and provides an excellent source for other researchers studying this area.
Benzer Tezler
- Dijital asistanlar için melez sınıflandırıcı: ontoloji tabanlı çoklu alanlı niyet havuzu yöntemi
Hybrid classifier for digital assistants: ontology-based multi-domain intent pooling method
ENES BULUT
Doktora
Türkçe
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolEge ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. MURAT OSMAN ÜNALIR
- Bir robot koluna kumanda eden doğal dil anlama sistemi
Başlık çevirisi yok
HASAN FERİT KEÇECİ
Yüksek Lisans
Türkçe
1996
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiPROF.DR. EŞREF ADALI
- Next-generation cell type annotation: Integrating NLP and ML techniques for enhanced scRNA classification
Yeni nesil hücre tipi anotasyonu: Geliştirilmiş scRNA sınıflandırması için NLP ve ML tekniklerinin entegrasyonu
ORÇUN SAMİ TANDOĞAN
Yüksek Lisans
İngilizce
2024
BiyoteknolojiOrta Doğu Teknik ÜniversitesiBiyoteknoloji Ana Bilim Dalı
YRD. DOÇ. DR. AYBAR CAN ACAR
DOÇ. DR. CAN ÖZEN
- The significance and the contribution of 6+1 traits of writing to the success of the students in writing courses in English language teaching
Yazmanın 6+1 özelliğinin İngilizce öğretiminde yazılı anlatım derslerindeki öğrenci başarısına katkısı ve önemi
ÖZLEM YAZAR
Yüksek Lisans
İngilizce
2004
Eğitim ve ÖğretimGazi Üniversitesiİngiliz Dili Eğitimi Ana Bilim Dalı
YRD. DOÇ. DR. PAŞA TEVFİK CEPHE
- Children participation and post occupancy evaluation in developing a communicative language to (re)design educational environments
Eğitim ortamlarının (yeniden) tasarımı için bir iletişim dili geliştirilmesinde kullanım sonrası değerlendirme ve çocukların katılımı
ODETA MANAHASA
Doktora
İngilizce
2017
Mimarlıkİstanbul Teknik ÜniversitesiMimarlık Ana Bilim Dalı
PROF. DR. FATMA AHSEN ÖZSOY