Geri Dön

Distributional investigation of some frequent turkish derivational affixes for exploring their semantics

Türkçedeki yüksek frekanslı yapım eklerinin semantiğinin keşfi için dağılımsal incelenmesi

  1. Tez No: 682521
  2. Yazar: GİZEM NUR ÖZDEMİR
  3. Danışmanlar: PROF. DR. HÜSEYİN CEM BOZŞAHİN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Dilbilim, Linguistics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2021
  8. Dil: İngilizce
  9. Üniversite: Orta Doğu Teknik Üniversitesi
  10. Enstitü: Enformatik Enstitüsü
  11. Ana Bilim Dalı: Bilişsel Bilim Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 78

Özet

Türkçe gibi sondan eklemeli dillerde türetme işlemi çoğunlukla ekin kelimenin sonuna getirilmesi ile gerçekleştirilir. Türevsel soneklerin birçoğu belirgin bir anlamsal içerik taşır ve bunları temsil etmek soru cevaplama gibi uygulamalarda önemli bir role sahiptir. Bu tezde amacımız, Türkçe'nin türevsel morfolojisinin dağılımsal ve semantik yapısını türevsel soneklerin kelime temsillerini kümeleyerek ve bunların altında yatan anlambilimsel özellikleri analiz ederek incelemektir. Sonek vektörleri, türetilmiş sözcüğün kök formunun vektörünün kendi kelime vektöründen çıkarılmasıyla elde edilmiştir. Kelime vektörlerini elde etmek için önceden eğitişmiş bir kelime temsili modeli, bu vektörleri kümelemek için ise birden fazla denetimsiz kümeleme algoritması farklı parametreler ile kullanılmıştır. Varsayımımız, eğer bir türevsel ek kategorisi bir veya daha fazla kümeye hakim olmayı başarırsa, dağılımsal vektör uzayında bu ekin güvenilir temsillerini elde etmenin mümkün olduğudur. Sonuçlarımız, birçok Türkçe türevsel ek kategorisinin bu yeteneğe sahip olduğunu göstermektedir. Oluşturulan kümelerin anlamsal yapısı soneklerin seçtiği tematik roller, köklerin ve türemiş kelimelerin sahip olabileceği UCCA etiketleri ve UD ilişkileri açısından analiz edilmiştir.

Özet (Çeviri)

In agglutinating languages such as Turkish, the process of derivation is mostly performed by adding suffixes at the end of words. Most of the derivational suffixes carry a distinctive semantic content and representing them has an important role in computational tasks, such as question answering. In this thesis, we aim to explore the structure of some frequent Turkish derivational suffixes in distributional vector space by clustering word embedding vectors of them and analyzing their underlying semantic properties. Suffix vectors are obtained by subtracting the vector of the base form of the derived word from the derived word's word vector. We used a pre-trained word embedding model for obtaining word vectors and multiple unsupervised clustering algorithms with different parameters for clustering them. Our assumption is if a derivational suffix category manages to dominate one or more clusters, it is possible to obtain reliable representations of it in the distributional vector space. Our results show that many Turkish derivational suffix categories have this capability. We analyzed the underlying semantic structure of the generated clusters in terms of the thematic roles the suffixes are selecting, the UCCA labels and the UD relations the stem and the derived word can get.

Benzer Tezler

  1. Karanlıkdere Vadisi'nin (Yozgat) phenopelopoid akarları üzerine sistematik araştırmalar

    Systematic investigations on the phenopelopoid mites of Karanlıkdere Valley (Yozgat)

    SALİH KÖKEZ

    Yüksek Lisans

    Türkçe

    Türkçe

    2015

    BiyolojiBozok Üniversitesi

    Biyoloji Ana Bilim Dalı

    YRD. DOÇ. DR. SEDAT PER

  2. The calculation debate in socialist economies

    Sosyalist ekonomilerde hesaplama tartışması

    SERCAN KARADOĞAN

    Yüksek Lisans

    İngilizce

    İngilizce

    2014

    Ekonomiİstanbul Bilgi Üniversitesi

    Uluslararası Ekonomi Politikası Ana Bilim Dalı

    PROF. DR. ERTUĞRUL TONAK

  3. The verbal functional domain in the Denizli dialect of Turkish

    Türkçe'nin Denizli ağzı'ndaki işlevsel eylem bölgesi

    YAĞMUR SAĞ

    Yüksek Lisans

    İngilizce

    İngilizce

    2013

    DilbilimBoğaziçi Üniversitesi

    Dilbilim Ana Bilim Dalı

    DOÇ. DR. AYŞE HAMİDE ASLI GÖKSEL

  4. Tam gömülü alt yirmi yaş dişlerinin folikül ebatları ile epidermal büyüme faktörü arasındaki ilişkinin araştırılması

    Exploration of the relation between impacted inferior third molar teeth follicle dimensions and epidermal growth factor

    YEŞİM ERKAN

    Doktora

    Türkçe

    Türkçe

    2013

    Diş HekimliğiGATA

    Ağız, Diş, Çene Hastalıkları ve Cerrahisi Ana Bilim Dalı

    PROF. DR. Necdet DOĞAN

  5. Lise çağı ergenlerde internet kullanımı ile yalnızlık düzeyleri arasındaki ilişkinin incelenmesi

    The relationship between internet use and loneliness in adolescents

    AÇELYA ESEN

    Yüksek Lisans

    Türkçe

    Türkçe

    2014

    PsikolojiHaliç Üniversitesi

    Psikoloji Ana Bilim Dalı

    YRD. DOÇ. DR. ZEHRA BANU SAYINER