Contextualized intent detection using generalized SemSpace and BLSTM
Generalized SemSpace ve BLSTM kullanarak bağlamsallaştırılmış niyet tespiti
- Tez No: 831154
- Danışmanlar: PROF. DR. UMUT ORHAN
- Tez Türü: Doktora
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2023
- Dil: İngilizce
- Üniversite: Çukurova Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 75
Özet
Bu tezde doğal dil işleme alanındaki niyet tespiti problemini çözmek için Contextualized Deep SemSpace adı verilen yeni bir yöntem geliştirilmiştir. Önerilen yöntemde ilk olarak generalized SemSpace yaklaşımıyla WordNet verilerinden anlama dayalı vektörler üretilmiş, kullanılan her veri setinin bağlamını temsil eden sözcükler bu vektör uzayında kümelenmiş ve sonrasında anlamı belirsiz olan kelimelerin bağlam kümesine en yakın anlam adayı seçilerek belirsizlik giderme işlemi yapılmıştır. Son olarak da ürettiğimiz anlama dayalı bağlamsallaştırılmış generalized SemSpace vektörleri BLSTM modeliyle eğitilmiştir. Elde edilen modelin başarısını ölçmek için iyi bilinen altı niyet tespit kıyaslama veri seti (ATIS, Snips, Facebook, AskUbuntu, WebApp ve Chatbot) üzerinde testler yapılmıştır. Karşılaştırma sonuçlarına göre önerilen yöntem hem anlama dayalı vektörler kullandığından hem de bağlama dayalı bir kelime belirsizliği giderme yöntemi içerdiğinden literatürde mevcut olan BERT, ELMo ve GPT gibi büyük dil modellerine benzer şekilde bağlama dayalı kelime vektörleri üretmektedir. Aynı zamanda bu yaklaşımın doğal dil işleme alanındaki birçok problemde başarıyla kullanılabileceği de öngörülmektedir.
Özet (Çeviri)
In this thesis, a novel method called Contextualized Deep SemSpace has been developed to address the problem of the intent detection problem in the field of natural language processing. In the proposed method, firstly, sense-based vectors are generated from WordNet data using the generalized SemSpace approach, words representing the context of each dataset are clustered in this vector space, and then the disambiguation process is carried out by selecting the closest sense candidate to the context cluster of the words whose sense was ambiguous. Finally, the sense-based contextualized SemSpace vectors we generated are trained with the Bidirectional Long Short-Term Memory (BLSTM) model. To measure the success of the resulting model, tests are conducted on six well-known intent detection benchmark datasets (ATIS, Snips, Facebook, AskUbuntu, WebApp, and Chatbot). According to the comparison results, the recommended method generates context-based word vectors similarly to large language models such as BERT, ELMo, and GPT which are available in the literature, beacuse it uses both sense-based vectors and a context-based word disambiguation method. It is also predicted that this approach can be used successfully in many problems in the field of natural language processing.
Benzer Tezler
- Eleştirel bir Ömer Kavur filmografyası denemesi
A critical appraisal of Ömer Kavur's filmography
GÜLAY YÜKSEL
Yüksek Lisans
Türkçe
2013
İletişim BilimleriYakın Doğu ÜniversitesiMedya Ve İletişim Çalışmaları Ana Bilim Dalı
PROF. DR. AHMET ÇİĞDEM
- Cultural memory, identity and music: Armenians of Turkey
Kültürel bellek, kimlik ve müzik: Türkiye Ermenileri
BURCU YILDIZ
Doktora
İngilizce
2012
Halk Bilimi (Folklor)İstanbul Teknik ÜniversitesiMüzik Ana Bilim Dalı
PROF. Ş. ŞEHVAR BEŞİROĞLU
DOÇ. DR. ROBERT REIGLE
- Sanat, iktidar, beden
Art, power, body
GÖKCEN MERYEM KILINÇ
Sanatta Yeterlik
Türkçe
2016
Güzel SanatlarAnadolu ÜniversitesiResim Ana Sanat Dalı
PROF. ZELİHA AKÇAOĞLU
- Marka sermayesinin oluşumu ve tüketici satınalma kararındaki etkisinin dayanıklı tüketim malları sektöründe incelenmesi
Creation of brand equity and its effects on consumer interactions in the purchase of consumer durable goods
BUKET BESEN
Doktora
Türkçe
2002
Mühendislik Bilimleriİstanbul Teknik Üniversitesiİşletme Mühendisliği Ana Bilim Dalı
PROF.DR. SELİME SEZGİN
- Yapı teknolojisi eğitiminde parametrik YBM destekli pedagojik yöntemlerin değerlendirilmesi
Evaluation of parametric BIM-enabled pedagogical methods in construction technology education
MEHMET ÜMİT METERELLİYOZ
Doktora
Türkçe
2023
Mimarlıkİstanbul Teknik ÜniversitesiBilişim Ana Bilim Dalı
DOÇ. DR. OZAN ÖNDER ÖZENER