Morphological tagging and lemmatization with neural components
Nöral bileşenler ile morfolojik etiketleme ve baş sözcük çıkarma
- Tez No: 510024
- Danışmanlar: DOÇ. DR. DENİZ YURET
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2018
- Dil: İngilizce
- Üniversite: Koç Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 55
Özet
Bu tezde MorphNet adını verdiğim, dilden bağımsız, uçtan-uca çalışan bir nöral model tarif ettim. MorphNet Biçimbilimsel Cözümleme ve Belirsizlik Giderme uygulamalarını eş zamanlı bir şekilde yapabilmek için tasarlanmıştır. Geleneksel olarak, biçimbilimsel olarak karmaşık dillerin analizi iki aşamalı olarak yapılmaktadır: (i) Sonlu durumlu dönüştürücüler tabanlı Biçimbilimsel Cözümleme uygulaması hedef sözcüğün olası tüm görülüş biçimlerini listeler, (ii) İstatistiksel Biçimbilimsel belirsizlik giderme uygulaması da kelimenin içinde bulunduğu bağlamı dikkate alarak doğru görülüş biçmini seçer. MorphNet'te diziden diziye nöral ağlar mimarisi kullanılarak Biçimbilimsel Cözümleme ve Belirsizlik giderme uygulamaları bir araya getirilmiştir. Modelde üç farklı Geri Dönüşümlü Yapay Sinir Ağı girdi kelimelerin çesitli özelliklerinin vektör uzayında kodlanmasında ve bir adet iki katmanlı Geri Dönüşümlü Yapay Sinir Ağı doğru biçimsel görülüşün üretilmesi için kullanılmaktadır. Bu tezde, doğru biçimbilimsel analizler ile etiketlenmiş data ile eğitildiğinde, MorphNet'in yirmi altı dilde geçmiş sistemlerden daha iyi veya kıyaslanabilir sonuçlar elde ettiği gösterilmiştir
Özet (Çeviri)
I describe and evaluate MorphNet, a language-independent, end-to-end model that is designed to combine morphological analysis and disambiguation. Traditionally, analysis of morphologically complex languages has been performed in two stages: (i) A morphological analyzer based on finite-state transducers produces all possible morphological analyses of a word, (ii) A statistical disambiguation model picks the correct analysis based on the context for each word. MorphNet uses a sequence-to-sequence recurrent neural network to combine analysis and disambiguation. The model consists of three LSTM encoders to create embeddings of various input features and a two layer LSTM decoder to predict the correct morphological analysis. When MorphNet is trained with text labeled with correct morphological analyses, the model is able to achieve state-of-the art or comparable results in twenty-six different languages.
Benzer Tezler
- Morphlaz: A finite-state morphological analyzer for laz
Morphlaz: Laz için sonlu durum biçimbilimsel çözümleyici
ESRA ÖNAL
Yüksek Lisans
İngilizce
2021
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi ÜniversitesiBilişsel Bilim Ana Bilim Dalı
DOÇ. DR. ARZUCAN ÖZGÜR TÜRKMEN
PROF. DR. BALKIZ BAŞARAN
- Tagging and morphological disambiguation of turkish text
Türkçe metinlerin işaretlenmesi ve biçimbirimsel çokyapılılık çözümlemesi
İLKER KURUÖZ
Yüksek Lisans
İngilizce
1994
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİhsan Doğramacı Bilkent ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. KEMAL OFLAZER
- Joint learning of morphological segmentation, morpheme tagging, part-of-speech tagging, and dependency parsing
Morfolojik analiz, sözcük türü işaretleme ve bağlılık ayrıştırmanın eş zamanlı öğrenilmesi
HÜSEYİN ALEÇAKIR
Yüksek Lisans
İngilizce
2020
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik ÜniversitesiBilişsel Bilim Ana Bilim Dalı
Prof. Dr. HÜSEYİN CEM BOZŞAHİN
DR. ÖĞR. ÜYESİ BURCU CAN BUĞLALILAR
- Verb sense disambiguation (VSD) in the Kyrgyz corpus and the problems of their morphological tagging
Kırgız derleminde fiil anlamının belirsizliği giderme (VSD) ve onların morfolojik etiketleme sorunları
AİZAT KADYRBEKOVA
Yüksek Lisans
İngilizce
2023
Mütercim-TercümanlıkKırgızistan-Türkiye Manas ÜniversitesiMütercim Tercümanlık Ana Bilim Dalı
DOÇ. DR. AİDA KASİEVA
- Supertagging with combinatory categorial grammar for dependency parsing
Bağlılık ayrıştırması için birleşenli ulamsal gramer ile süper etiıketleme
BURAK KERİM AKKUŞ
Yüksek Lisans
İngilizce
2014
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. RUKET ÇAKICI