Geri Dön

Contextualized intent detection using generalized SemSpace and BLSTM

Generalized SemSpace ve BLSTM kullanarak bağlamsallaştırılmış niyet tespiti

  1. Tez No: 831154
  2. Yazar: ELİF GÜLFİDAN TOSUN
  3. Danışmanlar: PROF. DR. UMUT ORHAN
  4. Tez Türü: Doktora
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2023
  8. Dil: İngilizce
  9. Üniversite: Çukurova Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 75

Özet

Bu tezde doğal dil işleme alanındaki niyet tespiti problemini çözmek için Contextualized Deep SemSpace adı verilen yeni bir yöntem geliştirilmiştir. Önerilen yöntemde ilk olarak generalized SemSpace yaklaşımıyla WordNet verilerinden anlama dayalı vektörler üretilmiş, kullanılan her veri setinin bağlamını temsil eden sözcükler bu vektör uzayında kümelenmiş ve sonrasında anlamı belirsiz olan kelimelerin bağlam kümesine en yakın anlam adayı seçilerek belirsizlik giderme işlemi yapılmıştır. Son olarak da ürettiğimiz anlama dayalı bağlamsallaştırılmış generalized SemSpace vektörleri BLSTM modeliyle eğitilmiştir. Elde edilen modelin başarısını ölçmek için iyi bilinen altı niyet tespit kıyaslama veri seti (ATIS, Snips, Facebook, AskUbuntu, WebApp ve Chatbot) üzerinde testler yapılmıştır. Karşılaştırma sonuçlarına göre önerilen yöntem hem anlama dayalı vektörler kullandığından hem de bağlama dayalı bir kelime belirsizliği giderme yöntemi içerdiğinden literatürde mevcut olan BERT, ELMo ve GPT gibi büyük dil modellerine benzer şekilde bağlama dayalı kelime vektörleri üretmektedir. Aynı zamanda bu yaklaşımın doğal dil işleme alanındaki birçok problemde başarıyla kullanılabileceği de öngörülmektedir.

Özet (Çeviri)

In this thesis, a novel method called Contextualized Deep SemSpace has been developed to address the problem of the intent detection problem in the field of natural language processing. In the proposed method, firstly, sense-based vectors are generated from WordNet data using the generalized SemSpace approach, words representing the context of each dataset are clustered in this vector space, and then the disambiguation process is carried out by selecting the closest sense candidate to the context cluster of the words whose sense was ambiguous. Finally, the sense-based contextualized SemSpace vectors we generated are trained with the Bidirectional Long Short-Term Memory (BLSTM) model. To measure the success of the resulting model, tests are conducted on six well-known intent detection benchmark datasets (ATIS, Snips, Facebook, AskUbuntu, WebApp, and Chatbot). According to the comparison results, the recommended method generates context-based word vectors similarly to large language models such as BERT, ELMo, and GPT which are available in the literature, beacuse it uses both sense-based vectors and a context-based word disambiguation method. It is also predicted that this approach can be used successfully in many problems in the field of natural language processing.

Benzer Tezler

  1. Eleştirel bir Ömer Kavur filmografyası denemesi

    A critical appraisal of Ömer Kavur's filmography

    GÜLAY YÜKSEL

    Yüksek Lisans

    Türkçe

    Türkçe

    2013

    İletişim BilimleriYakın Doğu Üniversitesi

    Medya Ve İletişim Çalışmaları Ana Bilim Dalı

    PROF. DR. AHMET ÇİĞDEM

  2. Cultural memory, identity and music: Armenians of Turkey

    Kültürel bellek, kimlik ve müzik: Türkiye Ermenileri

    BURCU YILDIZ

    Doktora

    İngilizce

    İngilizce

    2012

    Halk Bilimi (Folklor)İstanbul Teknik Üniversitesi

    Müzik Ana Bilim Dalı

    PROF. Ş. ŞEHVAR BEŞİROĞLU

    DOÇ. DR. ROBERT REIGLE

  3. Sanat, iktidar, beden

    Art, power, body

    GÖKCEN MERYEM KILINÇ

    Sanatta Yeterlik

    Türkçe

    Türkçe

    2016

    Güzel SanatlarAnadolu Üniversitesi

    Resim Ana Sanat Dalı

    PROF. ZELİHA AKÇAOĞLU

  4. Marka sermayesinin oluşumu ve tüketici satınalma kararındaki etkisinin dayanıklı tüketim malları sektöründe incelenmesi

    Creation of brand equity and its effects on consumer interactions in the purchase of consumer durable goods

    BUKET BESEN

    Doktora

    Türkçe

    Türkçe

    2002

    Mühendislik Bilimleriİstanbul Teknik Üniversitesi

    İşletme Mühendisliği Ana Bilim Dalı

    PROF.DR. SELİME SEZGİN

  5. Yapı teknolojisi eğitiminde parametrik YBM destekli pedagojik yöntemlerin değerlendirilmesi

    Evaluation of parametric BIM-enabled pedagogical methods in construction technology education

    MEHMET ÜMİT METERELLİYOZ

    Doktora

    Türkçe

    Türkçe

    2023

    Mimarlıkİstanbul Teknik Üniversitesi

    Bilişim Ana Bilim Dalı

    DOÇ. DR. OZAN ÖNDER ÖZENER