Geri Dön

Disclosing zipfian regularities in semantic breadth of words via multimodal gaussian embeddings

Çok modlu gauss kelime temsilleri ile sözcüklerin anlamsal genişliğindeki zipf'sel düzenliliklerin ortaya çıkarımı

  1. Tez No: 701456
  2. Yazar: FURKAN ŞAHİNUÇ
  3. Danışmanlar: DR. ÖĞR. ÜYESİ AYKUT KOÇ, PROF. DR. MEMDUH HALDUN ÖZAKTAŞ
  4. Tez Türü: Yüksek Lisans
  5. Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2021
  8. Dil: İngilizce
  9. Üniversite: İhsan Doğramacı Bilkent Üniversitesi
  10. Enstitü: Mühendislik ve Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Elektrik ve Elektronik Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 84

Özet

En yaygın ampirik düzenliliklerden biri olan Zipf kelime frekansları yasası, kelime frekansları ve kelimelerin frekans sıraları arasındaki bir kuvvet yasası ilişkisidir. Bu tezde, sözcüklerin anlamsal kararsızlıkları (anlamsal kapsayıcılıkları), noktasal dağılıma dayalı olmayan kelime temsilleri yoluyla nicel olarak incelenmiştir ve yeni bir Zipf'sel düzenlilik ortaya çıkarılmıştır. Bir kelimenin kararsızlığı ya da kapsayıcılığını; çok anlamlılık, kelimenin geniş bir anlama sahip olması (Örneğin, daha geniş duygu ve daha dar kızgınlık arasındaki ilişki gibi) veya her ikisinin birleşimi gibi nedenlerle artabilir. Sözcüklerin genellik-özgüllük düzeylerini ölçmeye değinen çalışmalar olmasına rağmen, bu tür özelliklerin Zipf'sel düzenlilikleri teorik bir arka plan ile nicel olarak gösterilmemektedir. Bu tezin temel amacı Zipf literatüründeki bu boşluğu doldurmaktır. Bu amaçla bir kelimenin farklı anlamlarda veya bağlamlarda ne kadar kullanılabileceğini ölçmek için Gauss temsillerinin varyansları kullanılmıştır. Noktasal olmayan Gauss temsillerinde gömülü olan varyans bilgisini kullanarak, çok anlamlılığın kontrol altına alındığı durumlarda, kelimelerin anlamsal genişliğinin de Zipf'sel düzenlilikler sergilediği nicel olarak gösterilmiştir. Bu sonuç, Zipf anlam dağılımı yasasını ve onunla ilgili olan anlam-frekans yasasını, Zipf'sel düzenliliklerin varlığını göstererek şu şekilde tamamlar: Daha sık kullanılan kelimeler genel anlamlı olma eğilimindeyken, daha az sıklıkta olanlar özel anlamlı olma eğilimindedir. Bulgularımızın genelleştirilmesini doğrulamak için Zipf'sel düzenlilikler, çok anlamlılığın nötrlenmesinde, farklı dil özelliklerinde ve İngilizce, Almanca, İspanyolca, Rusça ve Türkçe gibi farklı dil ailelerine mensup dillerde araştırılmıştır. Bu tür düzenlilikler, kelimelerin anlamsal özellikleri ile kelime frekansları arasındaki ilişkileri ortaya çıkarmak ve bu ilişkileri anlamak için değerli bilgiler sağlar. Çeşitli uygulamalarda, bu temel düzenlilikler kullanılarak performans iyileştirmeleri elde edilebilir. Temel sözcüksel gereklilik algılama algoritmalarının performansını geliştirmek için Zipf'sel düzenliliklerden yararlanmak için bir yöntem de önerilmiştir. Bildiğimiz kadarıyla, bu tez kelime frekansları ve anlamsal genişlik arasındaki ilişkileri incelemek için Gauss temsillerini kullanan ilk nicel çalışmadır.

Özet (Çeviri)

Being one of the most common empirical regularities, Zipf's law for word frequencies is a power-law relation between word frequencies and frequency ranks of words. In this thesis, the semantic uncertainty (i.e., semantic coverage) of words is quantitatively studied through non-point distribution-based word embeddings and a new Zipfian regularity is revealed. Uncertainty or semantic coverage of a word can increase due to several reasons such as polysemy, having a broad meaning (such as the relation between broader emotion and narrower exasperation) or a combination of both. Although there are studies that touch upon measuring the generality-specificity levels of words, Zipfian patterns of these features are not shown quantitatively with a theoretical background. Main aim of this thesis is to bridge this gap in the Zipfian literature. To this end, variances of Gaussian embeddings are utilized to quantify to what extent a word can be used in different senses or contexts. Using the variance information embedded in the non-point Gaussian embeddings, Zipfian patterns which exist in the semantic breadth of words are quantitatively shown when polysemy is controlled. This outcome is complementary to Zipf's law of meaning distribution and the related meaning-frequency law by indicating the existence of Zipfian patterns: more frequent words tend to be generic and uncertain. In contrast, less frequent ones tend to be specific. To verify the generalization of our findings, Zipfian patterns are investigated in the scope of the polysemy neutralization, various language properties and several languages from different language families: English, German, Spanish, Russian, and Turkish. Such regularities provide valuable information to extract and understand relationships between semantic properties of words and word frequencies. In various applications, performance improvements can be obtained by employing these fundamental regularities. A method is also proposed to leverage the Zipfian regularity to improve the performance of baseline lexical entailment detection algorithms. To the best of our knowledge, this thesis is the first quantitative study that uses Gaussian embeddings to examine the relationships between word frequencies and semantic breadth.

Benzer Tezler

  1. Disclosing the 'Other(s)' in Elif Shafak's The Island of Missing Trees and Christy Lefteri's Songbirds

    Elif Şafak'ın Kayıp Ağaçlar Adası (The Island of Missing Trees) ve Crısty Lefterı'nin Ötücü Kuşlar'ında (Songbirds) ötekilerin açığa çıkarılması

    GKIOULAI OUZOUN

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    İngiliz Dili ve EdebiyatıYeditepe Üniversitesi

    İngiliz Dili ve Edebiyatı Ana Bilim Dalı

    DOÇ. DR. CATHERINE MACMILLAN

  2. 'Beklenmeyen misafir': Suriyeli mültecilerin medyada temsili

    'Unexpected guest': Representation of Syrian refugees in the media

    CEYLAN LORTOĞLU

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    GazetecilikMarmara Üniversitesi

    Gazetecilik Ana Bilim Dalı

    PROF. DR. SELMA ULUS

  3. Factors affecting research and development (R&D) collaboration of multinational enterprises (mnes) and their local partner firms: A case study of Turkish automotive industry

    Çokuluslu firmalar ve yerel ortak firmalarının araştırma ve geliştirme (Ar-Ge)işbirliğine etki eden faktörler: Türk otomotiv endüstrisi örneği

    ASLI TUNCAY ÇELİKEL

    Doktora

    İngilizce

    İngilizce

    2009

    Bilim ve TeknolojiIşık Üniversitesi

    İşletme Bölümü

    PROF. DR. HACER ANSAL

  4. Farklı pekiştirme apareyleri uygulanan hastalarda plak boyama tableti kullanımının periodontal sağlığa etkisinin değerlendirilmesi

    The effect of plaque disclosing tablets on periodontal health in fixed and removable retainers

    AYŞEGÜL EŞSİZ DAĞDELEN

    Diş Hekimliği Uzmanlık

    Türkçe

    Türkçe

    2023

    Diş HekimliğiAdıyaman Üniversitesi

    Ortodonti Ana Bilim Dalı

    PROF. DR. NİHAL HAMAMCI

    DR. ÖĞR. ÜYESİ MEHMET ALİ YAVAN

  5. Wage determination under colective bargaining: inflation, productivity and profitability relationships (An empirical study)

    Toplu pazarlık sisteminde ücret belirleme: Enflasyon, verimlilik ve karlılık ilişkileri (ampirik çalışma)

    YEŞİM PINAR SOYKUT SARICA

    Doktora

    İngilizce

    İngilizce

    2008

    İşletmeIşık Üniversitesi

    İşletme Bölümü

    PROF. DR. TOKER DERELİ