Unsupervised learning of morphology
Morfolojinin denetimsiz öğrenimi
- Tez No: 765726
- Danışmanlar: PROF. DR. DENİZ YURET
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2022
- Dil: İngilizce
- Üniversite: Koç Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Veri Bilimi Ana Bilim Dalı
- Bilim Dalı: Bilgisayar Bilimi ve Mühendisliği Bilim Dalı
- Sayfa Sayısı: 63
Özet
Morfolojik kuralların denetimsiz öğrenilmesi, doğal dil işleme (NLP) modellerinin beklenen yeteneklerinden biridir, çünkü insanlar bu kuralları ana dili edinimleri sırasında denetimsiz olarak öğrenmektedirler. Bu beklentiye dayanarak, Autoencoders (AE), Variational Autoencoders (VAE), Character-level Language Models (CharLM) ve Vector Quantized Variational Autoencoders (VQVAE) gibi denetimsiz birçok modelin morfolojik öğrenmesini değerlendirmek için kapsamlı bir deneysel kurulum sunuyoruz. Çalışmamızda morfolojik özelliklerin sondalanması, morfolojik segmentasyon ve morfolojik yeniden çekim deneylerine yer veriyoruz. Deneylerimizde, tüm modellerin, morfolojik bilgiyi kodladığının bir göstergesi olarak sondalama deneylerinde taban modellerden daha iyi performanslar gösterdiğini; morfolojik segmentasyon için VAE ve CharLM'lerin SOTA modelleriyle karşılaştırılabilir performanslara sahip olduğunu; birden fazla kod kitabına sahip VQVAE'nin, bir kelimenin kökünü ve son eklerini belirleme yeteneğine sahip olduğunu ve bu açıdan morjolojik çekimsel görevlerini gerçekleştirmek için iyi bir aday olduğunu gösteriyoruz.
Özet (Çeviri)
Unsupervised learning of morphological rules is one of the expected abilities of natural language processing (NLP) models since children learn these rules during their native language acquisition without supervision. Based on this expectation, we present a comprehensive experimental setup for evaluating the morphological learning of several unsupervised models such as Autoencoders (AE), Variational Autoencoders (VAE), Character-level Language Models (CharLM) and Vector Quantized Variational Autoencoders (VQVAE) at the following tasks: probing for morphological features, morphological segmentation and morphological reinflection. In our study, we show that for probing, all models outperform baselines with an indication of encoding morphological knowledge; for morphological segmentation, VAE and CharLMs have comparable performances to unsupervised SOTA models; for morphological reinflection, VQVAE with multiple codebooks has the ability to identify the lemma and suffixes of a word and turns out to be a good candidate to perform inflectional tasks.
Benzer Tezler
- Statistical models for unsupervised learning of morphology and PoS
Gozetimsiz morfoloji ve soz dizim ısaretlerinin ogrenilmesi icin ıstatistiksel modeller
BURCU CAN BUĞLALILAR
Doktora
İngilizce
2012
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolYork UniversityBilgisayar ve Bilişim Mühendisliği Ana Bilim Dalı
PROF. DR. SURESH MANANDHAR
- Morphological segmentation using Dirichlet process based bayesian non-parametric models
Dirichlet süreci temelli parametrik olmayan bayes modelleri ile morfolojik bölümleme
SERKAN KUMYOL
Yüksek Lisans
İngilizce
2016
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik ÜniversitesiBilişsel Bilim Ana Bilim Dalı
PROF. DR. HÜSEYİN CEM BOZŞAHİN
YRD. DOÇ. DR. BURCU CAN BUĞLALILAR
- Dendritic spine shape analysis based on two-photon microscopy images
İki foton mikroskobik görüntüleri kullanarak dendritik diken şekil analizi
MUHAMMAD USMAN GHANI
Yüksek Lisans
İngilizce
2016
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSabancı ÜniversitesiBilgisayar Bilimleri Ana Bilim Dalı
DOÇ. DR. MÜJDAT ÇETİN
- Machine-learning approaches for neurological disorder diagnosis from genomic and neuroimaging data
Genomik ve nörogörüntüleme verilerinden nörolojik bozukluk teşhisi için makine öğrenmesi yaklaşımları
İSMAİL BİLGEN
Doktora
İngilizce
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. BEHÇET UĞUR TÖREYİN
- Quantitative ways of measuring natural language change through time and location
Doğal dillerin zaman ve konuma bağlı değişimlerinin nicel olarak ölçülmesi
MUHAMMED ENES ALMAHDI
Yüksek Lisans
İngilizce
2020
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGebze Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. YUSUF SİNAN AKGÜL