A novel framework for morphological processing of Turkish
Türkçe morfolojinin işlenmesi için yeni bir çerçeve
- Tez No: 840670
- Danışmanlar: PROF. DR. TUNGA GÜNGÖR, DR. ÖĞR. ÜYESİ ÜMİT ATLAMAZ
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Dilbilim, Computer Engineering and Computer Science and Control, Linguistics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2023
- Dil: İngilizce
- Üniversite: Boğaziçi Üniversitesi
- Enstitü: Sosyal Bilimler Enstitüsü
- Ana Bilim Dalı: Bilişsel Bilim Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 69
Özet
Morfolojik, yani biçimbirimsel çözümleme, kelimelerin bilgisayarca kökleri ile eklerine ayrılması işidir. Türkçe için çeşitli çözümleyiciler vardır; bunlar başarılı bir şekilde, özellikle çekim eklerinin yapısını çözümleyebilirler. Fakat literatürde kimi yabancı kökenli kelimelerin bükümlü yapısının analizi, ön eklerin desteklenmesi, yapım eklerinin geniş bir şekilde kapsanması yönünden kimi eksiklikler vardır. Bu eksikliklere çözüm aramak için bu tezde Türkçe için yeni birtakım normlara dayanan bir hesaplamalı morfolojik işleme çerçevesi tanımlanıp uygulanmıştır. Bu ilkeler, doğal dil işleme alanındaki güncel olanaklar ile gereksinimlere dayanır. Bunların başında dönüştürücü (transformer) tabanlı, önceden eğitilmiş büyük dil modelleri ile ince ayarlama yaklaşımları gelir. Çerçeve, dil kaynakları yapısının açıklamasını, kelimelerin tüm olası çözümlemelerini inceleyen bir morfolojik analizciyi, analizci çıktıları arasından doğru hipotezi seçen bir morfolojik muğlaklık gidericiyi ve bu araçlar için hata analizi modüllerini içermektedir.
Özet (Çeviri)
Morphological parsing is the computational task of breaking down words into their roots and affixes. There are several successful morphological parsers for Turkish, especially for inflectional morphology. However, there is a gap in the literature concerning the analysis of fusional properties of foreign-origin words, support for prefixes, and comprehensive derivational suffix coverage. To address this gap, this thesis describes and implements a new computational morphological processing framework for Turkish with novel principles. These principles are based on the recent opportunities and requirements in the natural language processing field, namely the transformer-based pre-trained large language models and fine-tuning approaches. The framework contains a description of language resources structure, a morphological analyzer that examines all possible parses of a word, a morphological disambiguator that picks the correct hypothesis among analyzer outputs, and error analysis modules for these tools.
Benzer Tezler
- Developing a comprehensive framework for sentiment analysis in Turkish
Türkçe için kapsamlı bir duygu analizi çatısı geliştirme
CEM RIFKI AYDIN
Doktora
İngilizce
2020
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. TUNGA GÜNGÖR
PROF. DR. SADIK FİKRET GÜRGEN
DR. ÖĞR. ÜYESİ TEVFİK AYTEKİN
- A bayesian model of turkish derivational morphology
Türkçe türetim morfolojisinin bayes ağları ile modellenmesi
UTKU CAN KUNTER
Doktora
İngilizce
2023
MorfolojiOrta Doğu Teknik ÜniversitesiBilişsel Bilim Ana Bilim Dalı
PROF. DR. HÜSEYİN CEM BOZŞAHİN
- Development of an experimental image processing tool and flow-cytometry based electromagnetic scattering analysis for medical diagnosis of red blood cell pathology
Kırmızı kan hücresi patolojisinin tıbbi teşhişi için deneysel gorüntü işleme aracının ve akış-sitometri esaslı elektromanyetik saçılım analizinin geliştirilmesi
POLAT GÖKTAŞ
Doktora
İngilizce
2020
Elektrik ve Elektronik Mühendisliğiİhsan Doğramacı Bilkent ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
PROF. DR. VAKUR BEHÇET ERTÜRK
PROF. DR. AYHAN ALTINTAŞ
- Integrating morphology into automatic speech recognition: Morpholexical and discriminative language models for Turkish
Biçimbilimin otomatik konuşma tanımaya bütünleştirilmesi: Türkçe için biçimsözlüksel ve ayırıcı dil modelleri
HAŞİM SAK
Doktora
İngilizce
2011
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. MURAT SARAÇLAR
DOÇ. DR. TUNGA GÜNGÖR
- Türkçe tümcelerin yüklem odaklı anlam ve dilbilgisi çözümlemesi
Grammatical and semantic analysis of turkish sentence based on predicate
İLKNUR DÖNMEZ
Doktora
Türkçe
2016
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. EŞREF ADALI