Geri Dön

Morphological tagging and lemmatization with neural components

Nöral bileşenler ile morfolojik etiketleme ve baş sözcük çıkarma

  1. Tez No: 510024
  2. Yazar: ERENAY DAYANIK
  3. Danışmanlar: DOÇ. DR. DENİZ YURET
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2018
  8. Dil: İngilizce
  9. Üniversite: Koç Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 55

Özet

Bu tezde MorphNet adını verdiğim, dilden bağımsız, uçtan-uca çalışan bir nöral model tarif ettim. MorphNet Biçimbilimsel Cözümleme ve Belirsizlik Giderme uygulamalarını eş zamanlı bir şekilde yapabilmek için tasarlanmıştır. Geleneksel olarak, biçimbilimsel olarak karmaşık dillerin analizi iki aşamalı olarak yapılmaktadır: (i) Sonlu durumlu dönüştürücüler tabanlı Biçimbilimsel Cözümleme uygulaması hedef sözcüğün olası tüm görülüş biçimlerini listeler, (ii) İstatistiksel Biçimbilimsel belirsizlik giderme uygulaması da kelimenin içinde bulunduğu bağlamı dikkate alarak doğru görülüş biçmini seçer. MorphNet'te diziden diziye nöral ağlar mimarisi kullanılarak Biçimbilimsel Cözümleme ve Belirsizlik giderme uygulamaları bir araya getirilmiştir. Modelde üç farklı Geri Dönüşümlü Yapay Sinir Ağı girdi kelimelerin çesitli özelliklerinin vektör uzayında kodlanmasında ve bir adet iki katmanlı Geri Dönüşümlü Yapay Sinir Ağı doğru biçimsel görülüşün üretilmesi için kullanılmaktadır. Bu tezde, doğru biçimbilimsel analizler ile etiketlenmiş data ile eğitildiğinde, MorphNet'in yirmi altı dilde geçmiş sistemlerden daha iyi veya kıyaslanabilir sonuçlar elde ettiği gösterilmiştir

Özet (Çeviri)

I describe and evaluate MorphNet, a language-independent, end-to-end model that is designed to combine morphological analysis and disambiguation. Traditionally, analysis of morphologically complex languages has been performed in two stages: (i) A morphological analyzer based on finite-state transducers produces all possible morphological analyses of a word, (ii) A statistical disambiguation model picks the correct analysis based on the context for each word. MorphNet uses a sequence-to-sequence recurrent neural network to combine analysis and disambiguation. The model consists of three LSTM encoders to create embeddings of various input features and a two layer LSTM decoder to predict the correct morphological analysis. When MorphNet is trained with text labeled with correct morphological analyses, the model is able to achieve state-of-the art or comparable results in twenty-six different languages.

Benzer Tezler

  1. Morphlaz: A finite-state morphological analyzer for laz

    Morphlaz: Laz için sonlu durum biçimbilimsel çözümleyici

    ESRA ÖNAL

    Yüksek Lisans

    İngilizce

    İngilizce

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi Üniversitesi

    Bilişsel Bilim Ana Bilim Dalı

    DOÇ. DR. ARZUCAN ÖZGÜR TÜRKMEN

    PROF. DR. BALKIZ BAŞARAN

  2. Tagging and morphological disambiguation of turkish text

    Türkçe metinlerin işaretlenmesi ve biçimbirimsel çokyapılılık çözümlemesi

    İLKER KURUÖZ

    Yüksek Lisans

    İngilizce

    İngilizce

    1994

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİhsan Doğramacı Bilkent Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. KEMAL OFLAZER

  3. Joint learning of morphological segmentation, morpheme tagging, part-of-speech tagging, and dependency parsing

    Morfolojik analiz, sözcük türü işaretleme ve bağlılık ayrıştırmanın eş zamanlı öğrenilmesi

    HÜSEYİN ALEÇAKIR

    Yüksek Lisans

    İngilizce

    İngilizce

    2020

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik Üniversitesi

    Bilişsel Bilim Ana Bilim Dalı

    Prof. Dr. HÜSEYİN CEM BOZŞAHİN

    DR. ÖĞR. ÜYESİ BURCU CAN BUĞLALILAR

  4. Verb sense disambiguation (VSD) in the Kyrgyz corpus and the problems of their morphological tagging

    Kırgız derleminde fiil anlamının belirsizliği giderme (VSD) ve onların morfolojik etiketleme sorunları

    AİZAT KADYRBEKOVA

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Mütercim-TercümanlıkKırgızistan-Türkiye Manas Üniversitesi

    Mütercim Tercümanlık Ana Bilim Dalı

    DOÇ. DR. AİDA KASİEVA

  5. Supertagging with combinatory categorial grammar for dependency parsing

    Bağlılık ayrıştırması için birleşenli ulamsal gramer ile süper etiıketleme

    BURAK KERİM AKKUŞ

    Yüksek Lisans

    İngilizce

    İngilizce

    2014

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. RUKET ÇAKICI