Geri Dön

Unsupervised learning of morphology

Morfolojinin denetimsiz öğrenimi

  1. Tez No: 765726
  2. Yazar: MÜGE KURAL
  3. Danışmanlar: PROF. DR. DENİZ YURET
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2022
  8. Dil: İngilizce
  9. Üniversite: Koç Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Veri Bilimi Ana Bilim Dalı
  12. Bilim Dalı: Bilgisayar Bilimi ve Mühendisliği Bilim Dalı
  13. Sayfa Sayısı: 63

Özet

Morfolojik kuralların denetimsiz öğrenilmesi, doğal dil işleme (NLP) modellerinin beklenen yeteneklerinden biridir, çünkü insanlar bu kuralları ana dili edinimleri sırasında denetimsiz olarak öğrenmektedirler. Bu beklentiye dayanarak, Autoencoders (AE), Variational Autoencoders (VAE), Character-level Language Models (CharLM) ve Vector Quantized Variational Autoencoders (VQVAE) gibi denetimsiz birçok modelin morfolojik öğrenmesini değerlendirmek için kapsamlı bir deneysel kurulum sunuyoruz. Çalışmamızda morfolojik özelliklerin sondalanması, morfolojik segmentasyon ve morfolojik yeniden çekim deneylerine yer veriyoruz. Deneylerimizde, tüm modellerin, morfolojik bilgiyi kodladığının bir göstergesi olarak sondalama deneylerinde taban modellerden daha iyi performanslar gösterdiğini; morfolojik segmentasyon için VAE ve CharLM'lerin SOTA modelleriyle karşılaştırılabilir performanslara sahip olduğunu; birden fazla kod kitabına sahip VQVAE'nin, bir kelimenin kökünü ve son eklerini belirleme yeteneğine sahip olduğunu ve bu açıdan morjolojik çekimsel görevlerini gerçekleştirmek için iyi bir aday olduğunu gösteriyoruz.

Özet (Çeviri)

Unsupervised learning of morphological rules is one of the expected abilities of natural language processing (NLP) models since children learn these rules during their native language acquisition without supervision. Based on this expectation, we present a comprehensive experimental setup for evaluating the morphological learning of several unsupervised models such as Autoencoders (AE), Variational Autoencoders (VAE), Character-level Language Models (CharLM) and Vector Quantized Variational Autoencoders (VQVAE) at the following tasks: probing for morphological features, morphological segmentation and morphological reinflection. In our study, we show that for probing, all models outperform baselines with an indication of encoding morphological knowledge; for morphological segmentation, VAE and CharLMs have comparable performances to unsupervised SOTA models; for morphological reinflection, VQVAE with multiple codebooks has the ability to identify the lemma and suffixes of a word and turns out to be a good candidate to perform inflectional tasks.

Benzer Tezler

  1. Statistical models for unsupervised learning of morphology and PoS

    Gozetimsiz morfoloji ve soz dizim ısaretlerinin ogrenilmesi icin ıstatistiksel modeller

    BURCU CAN BUĞLALILAR

    Doktora

    İngilizce

    İngilizce

    2012

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolYork University

    Bilgisayar ve Bilişim Mühendisliği Ana Bilim Dalı

    PROF. DR. SURESH MANANDHAR

  2. Morphological segmentation using Dirichlet process based bayesian non-parametric models

    Dirichlet süreci temelli parametrik olmayan bayes modelleri ile morfolojik bölümleme

    SERKAN KUMYOL

    Yüksek Lisans

    İngilizce

    İngilizce

    2016

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik Üniversitesi

    Bilişsel Bilim Ana Bilim Dalı

    PROF. DR. HÜSEYİN CEM BOZŞAHİN

    YRD. DOÇ. DR. BURCU CAN BUĞLALILAR

  3. Dendritic spine shape analysis based on two-photon microscopy images

    İki foton mikroskobik görüntüleri kullanarak dendritik diken şekil analizi

    MUHAMMAD USMAN GHANI

    Yüksek Lisans

    İngilizce

    İngilizce

    2016

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSabancı Üniversitesi

    Bilgisayar Bilimleri Ana Bilim Dalı

    DOÇ. DR. MÜJDAT ÇETİN

  4. Machine-learning approaches for neurological disorder diagnosis from genomic and neuroimaging data

    Genomik ve nörogörüntüleme verilerinden nörolojik bozukluk teşhisi için makine öğrenmesi yaklaşımları

    İSMAİL BİLGEN

    Doktora

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. BEHÇET UĞUR TÖREYİN

  5. Quantitative ways of measuring natural language change through time and location

    Doğal dillerin zaman ve konuma bağlı değişimlerinin nicel olarak ölçülmesi

    MUHAMMED ENES ALMAHDI

    Yüksek Lisans

    İngilizce

    İngilizce

    2020

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGebze Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. YUSUF SİNAN AKGÜL