Geri Dön

Enriching contextual word embeddings with character information

Bağlamsal kelime gömmelerinin karakter bilgisi ile zenginleştirilmesi

  1. Tez No: 631243
  2. Yazar: OZAN POLATBİLEK
  3. Danışmanlar: DR. ÖĞR. ÜYESİ SELMA TEKİR
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2020
  8. Dil: İngilizce
  9. Üniversite: İzmir Yüksek Teknoloji Enstitüsü
  10. Enstitü: Lisansüstü Eğitim Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 89

Özet

Doğal dil işleme, günümüzdeki yapay zeka gelişmelerinin de yardımıyla popülerlik kazanmıştır. Bu popülerlik sayesinde farklı alt alanlarda yüksek başarımlı çalışmalar yayınlanmaktadır. Bu alt alanlardan birisi de doğal dil işlemenin temel problemlerinden birini ele alan kelimelerin vektörel gösterimi alanıdır. Kelimelerin sözdizimi ve anlamsal bilgilerini ihtiva etmesi amacıyla vektörel gösterim kullanılmaktadır. Yakın zamanda yayınlanan BERT modeli ile kelime vektörleri bağlamsal olarak yüksek bir başarım ile gösterilebilmektedir. Öte yandan bu model sözdizimi kurallarını gözlemleyecek karakter seviyesinde bir yapı içermediğinden, Türkçe gibi morfolojik olarak zengin dillerde istenen sonuçları veremeyebilmektedir. Bu çalışmada, BERT modelinin karakter seviyesinde de bilgi işleyebilmesini sağlamak amacıyla, BERT-ELMo modeli önerilmiştir. Bu yeni önerilen modelde, ELMo modelinin karakter seviyesinde işlem yapabilen modülü ile BERT modelinin bağlamsal kelime vektörü üreten modülü birleştirilmiştir. BERT-ELMo modeli hem nicel and nitel analizler ile incelenmiş ve BERT modeli ile Türkçe dili üzerinden karşılaştırılmıştır. Karakter seviyesindeki ekleme sebebiyle, önerilen model herhangi bir dilde herhangi bir ön çalışma yapılmaksızın çalıştırılabilir. Bilinen kadarıyla, bu çalışma Türkçe morfolojik analizi ile BERT modelini eğiten ve BERT modeline karakter seviyesinde bir modül eklemeyi deneyen ilk çalışmadır.

Özet (Çeviri)

Natural Language Processing has become more and more popular with the recent advances in Artificial Intelligence. Fundamental improvements have been introduced in word representations to store semantic and/or syntactic features. With the recently published language model BERT, contextual word vectors could be generated. This model do not process character level information. In morphologically rich languages such as Turkish, this model's perception of syntax could be improved. In this thesis, a new model, called BERT-ELMo, which is a combination of BERT and ELMo, is proposed to enrich BERT with character level information. This model combines character level processing part of ELMo and contextual word representation part of the BERT model. To show the effectiveness of the proposed model, both quantitative (question answering) and qualitative (word analogy, word contextualization, morphological meaning, out of vocabulary word capturing) analyses are performed and it is compared with BERT on Turkish language. Thanks to character level addition, proposed model is able get trained in any language without any pre-analysis.To the best of our knowledge, this is the first study which uses morphological analysis to train the BERT model in Turkish, and the first model to integrate a character level module to BERT.

Benzer Tezler

  1. Antepli Aynî Divanı'nın bağlamsal dizini ve işlevsel sözlüğü

    Contextual index and functional dictionary of the Divan of Antepli Aynî

    MUSTAFA AKAY

    Doktora

    Türkçe

    Türkçe

    2023

    Türk Dili ve EdebiyatıGaziantep Üniversitesi

    Türk Dili ve Edebiyatı Ana Bilim Dalı

    PROF. DR. HALİL İBRAHİM YAKAR

  2. From words to sentences: Advancing Turkish emotion analysis through emotion enrichment

    Kelimelerden cümlelere: Duygu zenginleştirme ile Türkçe duygu analizini geliştirme

    HANDE AKA UYMAZ

    Doktora

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİzmir Ekonomi Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. SENEM KUMOVA METİN

  3. Une analyse structurale du film Angel-A de Luc Besson

    Luc Besson'un Angel-A filminin yapısalcı çözümlemesi

    ZEYNEP BÜŞRA BÖLÜKBAŞI

    Yüksek Lisans

    Fransızca

    Fransızca

    2013

    DilbilimGalatasaray Üniversitesi

    Fransız Dili ve Edebiyatı Ana Bilim Dalı

    YRD. DOÇ. DR. ATİLLA DEMİRCİOĞLU

  4. Alan yönetim planı ve kentsel tasarım etkileşiminde yeni bir süreç önerisi: Priene antik kent örneği

    A new process proposal for the interaction between site management plan and urban design: The case of Priene ancient city

    FATMA ÇAĞLA ŞEVİK

    Yüksek Lisans

    Türkçe

    Türkçe

    2022

    Şehircilik ve Bölge PlanlamaMimar Sinan Güzel Sanatlar Üniversitesi

    Şehir ve Bölge Planlama Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ MELİH BİRİK

    DOÇ. DR. YAŞAR DİLEK ERBEY

  5. Behişti Ahmed Sinan İskendernamesi'nin bağlamlı dizin ve işlevsel sözlüğü

    Contextual index and functional dictionary of bBehisti Ahmed Sinan's Iskendername

    MUSTAFA YİĞİT

    Doktora

    Türkçe

    Türkçe

    2023

    Türk Dili ve EdebiyatıEskişehir Osmangazi Üniversitesi

    Türk Dili ve Edebiyatı Ana Bilim Dalı

    DOÇ. DR. TUBA ONAT ÇAKIROĞLU