Geri Dön

Exponential word embeddings: Models and approximate learning

Başlık çevirisi mevcut değil.

  1. Tez No: 622574
  2. Yazar: İBRAHİM TURGUN KEKEÇ
  3. Danışmanlar: PROF. DR. A
  4. Tez Türü: Doktora
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Mekatronik Mühendisliği, Computer Engineering and Computer Science and Control, Mechatronics Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2019
  8. Dil: İngilizce
  9. Üniversite: Technische Universiteit Delft (Delft University of Technology)
  10. Enstitü: Yurtdışı Enstitü
  11. Ana Bilim Dalı: Belirtilmemiş.
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 130

Özet

Learning probability densities for natural language representations is a difficult problem because language is inherently sparse and high-dimensional. Negative sampling is a popular and effective way to avoid intractable maximum likelihood problems, but it requires correct specification of the sampling distribution. Previous state of the art methods rely on heuristic distributions that appear to do well in practice. In this work, we define conditions for optimal sampling distributions and demonstrate how to approximate them using Quadratically Constrained Entropy Maximization (QCEM). Our analysis shows that state of the art heuristics are restrictive approximations to our proposed framework. To demonstrate the merits of our formulation, we apply QCEM to matching synthetic exponential family distributions and to finding high dimensional word embedding vectors for English. We are able to achieve faster inference on synthetic experiments and improve the correlation on semantic similarity evaluations on the Rare Words dataset by 4.8%.

Özet (Çeviri)

Özet çevirisi mevcut değil.

Benzer Tezler

  1. Kelime gömme vektörlerinin graf dönüşümü yoluyla metin sınıflandırmada kullanımı

    Use of word embedding vectors in text classification through graph conversion

    ELİF DORUKBAŞI

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKarabük Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. İLKER TÜRKER

  2. Zaman Serisi Analizi ve Derin Öğrenme Modelleri Kullanarak Amerikan Doları/Türk Lirası Döviz Kuru İçin Hibrid Tahmin Modeli

    A Hybrid Forecasting Model for American Dollar/Turkish Lira Exchange Rate Using Time Series Analysis and Deep Learning Models

    HARUN YAŞAR

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolDoğuş Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ZEYNEP HİLAL KİLİMCİ

  3. Derin öğrenme algoritmalarıyla duygu analizi

    Sentiment analysis with deep learning algorithms

    MUHAMMED ÇAĞRI ELVERİŞLİ

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    Elektrik ve Elektronik MühendisliğiYıldız Teknik Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ MURAT TAŞKIRAN

  4. Evaluation of cosine similarity feature results with different experimental setups for named entity recognition on tweets

    Varlık ismi tanımlama üzerine kosinüs benzerliği özelliğinin farklı örneklemlerde değerlendirilmesi

    ONUR BÜYÜKTOPAÇ

    Yüksek Lisans

    İngilizce

    İngilizce

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGalatasaray Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. TANKUT ACARMAN

  5. Akademik makale öneri sistemi

    Academic article recommender system

    İLYA KUŞ

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    Bilim ve TeknolojiEskişehir Osmangazi Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ SİNEM BOZKURT KESER