Geri Dön

Analysis of SCODE word embeddings based on substitute distributions in supervised tasks

SCODE kelime gömülerinin gözetimli görevlerde incelenmesi

  1. Tez No: 367642
  2. Yazar: VOLKAN CİRİK
  3. Danışmanlar: DOÇ. DR. DENİZ YURET
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2014
  8. Dil: İngilizce
  9. Üniversite: Koç Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 46

Özet

Doğal dil işleme ile ilgilenen bilim insanlarının ilgi alanlarından biri de kelimeleri temsil edebilecekleri modeller bulmaktır. Kelime gömüleri her kelimeyi düşük boyutlarda, gerçel değerli, yoğun vektörler olarak gösterir ve en yaygın yöntemlerden biri haline gelmiştir. Kelime gömüleri klasik kategoriksel gösterimlerine yerine bir seçenek olarak görülmektedir. Kelime gömüleri bir kelimenin sözdizimsel ve anlamsal özelliklerini bir vektörün boyutlarında temsil eder. Bu temsillerin Varlık İsmi Tanımlama, Sözdizimsel Analiz gibi gözetimli doğal dil işleme görevlerinde başarılı olduğu gösterilmiştir. Bu çalışmada, bir kelime gömü yöntemini gözetimli doğal dil işleme görevlerinde inceliyorum. Yöntem, kelimeleri bir küre üzerinde temsil eder, öyle ki aynı bağlamda gözlenen kelimeler bu küre üzerinde yakın şekilde konumlandırılır. Bağlamların benzerliği ise o bağlamda gözlenebilecek kelimelerin olasılıksal dağılımları kullanılarak yapılır. Kelime gömülerini Varlık İsmi Tanımlama, Gruplama ve Bağlılık Ayrıştırması görevlerinde karşılaştırdım. İncelediğim yöntem en az diğerleri kadar başarılı ya da onlardan daha başarılı sonuçlar almıştır. Yöntem başarını çok dilli incelemelerde de sürdürmüştür ve Bağlılık Ayrıştırması görevinde bilinen en iyi sonuçları elde etmiştir.

Özet (Çeviri)

One of the interests of the Natural Language Processing (NLP) community is to find representations for lexical items using large amount of unlabeled data. Inducing low-dimensional, continuous, dense word vectors, or word embeddings, have become the principal technique to find representations for words. Word embeddings address the issues of the classical categorical representation of words by capturing syntactic and semantic information of words in the dimensions of a vector. These representations are shown to be successful across NLP tasks including Named Entity Recognition, Part-of-speech Tagging, Parsing, and Semantic Role Labeling. In this work, I analyze a word embedding method in supervised Natural Language Processing (NLP) tasks. The framework maps words on a sphere such that words co-occurring in similar contexts lie closely. The similarity of contexts is measured by the distribution of substitutes that can fill them. I compared word embeddings, including more recent representations, in Named Entity Recognition (NER), Chunking, and Dependency Parsing. I examine the framework in a multilingual setup as well. The results show that the examined method achieves as good as or better results compared to the other word embeddings. The framework is consistent in improving the baseline systems across languages and achieves state-of-the-art results in multilingual dependency parsing.

Benzer Tezler

  1. Analysis of context embeddings in word sense induction

    Bağlam gömülerinin sözcük anlamı tümevarımda incelenmesi

    OSMAN BAŞKAYA

    Yüksek Lisans

    İngilizce

    İngilizce

    2015

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKoç Üniversitesi

    Bilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı

    DOÇ. DR. DENİZ YURET

  2. bi-TEZAT: biLSTM yöntemiyle türkçe şikayet metinlerinde zaman ifadelerinin tespit edilmesi

    Bi-TEZAT: extract temporal expressions on turkish complaint texts via biLSTM

    ENSAR EMİRALİ

    Yüksek Lisans

    Türkçe

    Türkçe

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolYıldız Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. MİNE ELİF KARSLIGİL YAVUZ

  3. Türkçe metinlerde farklı temsil modelleri ve öğrenme yöntemleri ile duygu analizi karşılaştırması

    Comparison of sentiment analysis with different representation models and learning methods in Turkish texts

    KADRİYE MARANGOZ

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBursa Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ MUSTAFA ÖZGÜR CİNGİZ

  4. Kitlesel çevrimiçi ders platformlarında kurslara yapılan yorumların metin madenciliği kullanılarak duygu analizi

    Sentiment analysis of comments on courses on massive online course platforms using text mining

    RAMAZAN DAŞGIN

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    Yönetim Bilişim SistemleriAksaray Üniversitesi

    Yönetim Bilişim Sistemleri Ana Bilim Dalı

    DOÇ. DR. KEMAL ADEM

  5. Analysis of gender bias in legal texts using natural language processing methods

    Hukuki metinlerdeki cinsiyetçi önyargının doğal dil işleme metotlarıyla analizi

    NURULLAH SEVİM

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Elektrik ve Elektronik Mühendisliğiİhsan Doğramacı Bilkent Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ AYKUT KOÇ