Automated response generation for corporate chatbot systems

Kurumsal chatbot sistemleri için otomatik cevap üretme

PDF İndir

Tez No: 632801
Yazar: ABDULLAH ŞAMİL GÜSER
Danışmanlar: PROF. DR. MUSTAFA LEVENT ARSLAN
Tez Türü: Yüksek Lisans
Konular: Bankacılık, Dilbilim, Elektrik ve Elektronik Mühendisliği, Banking, Linguistics, Electrical and Electronics Engineering
Anahtar Kelimeler: Belirtilmemiş.
Yıl: 2020
Dil: İngilizce
Üniversite: Boğaziçi Üniversitesi
Enstitü: Fen Bilimleri Enstitüsü
Ana Bilim Dalı: Elektrik ve Bilgisayar Mühendisliği Ana Bilim Dalı
Bilim Dalı: Elektrik Elektronik Mühendisliği Bilim Dalı
Sayfa Sayısı: 86

Özet

Bu çalışmada Türkçe dilinde müşteri hizmetleri chatbotu tasarımı için halihazır- daki niyet sınıflandırma ve cevap seçimi metotları üzerinde çalışıldı. Literatürdeki chatbot tipleri karşılaştırıldı. İmplementasyonu ve uyarlanması kolay yöntemler üzerine odaklanıldığı ve çalışmanın uygulama alanına uyduğu için kapalı alan, görev yönelimli, seçim tabanlı tipteki chatbotlar üzerinde çalışıldı. Niyet sınıflandırma ve cevap seçme olmak üzere iki farklı implementasyon alternatifi karşılaştırıldı. Diyalog geçmişini eğitime dahil etmenin etkisi gözlemlendi. Etiketli veriler için Doğal Dil Çıkarımı yöntemi kullanarak yeni bir sınıflandırma yöntemi önerildi. Türkçe bitişimli bir dil olduğu için literatürdeki hazır yöntemlerin birçoğu İngilizce verilerde olduğu kadar iyi çalışmamaktadır. Bundan dolayı, farklı yapay sinir ağı modelleriyle bu yöntemlerin farklı datasetlerdeki performansları kıyaslandı. En iyi yöntemlerin ve ön-eğitilmiş dil modellerinin sınıflandırma ve doğal dil çıkarımı problemlerindeki performansları incelendi. Türkçe veri kümelerindeki başarının İngilizce'dekine göre düşük çıkmasına sebep olan faktörler üzerinde çalışıldı ve birkaç temel problem tanımlandı. Daha sonra bu problemlere çözümler önerilerek Türkçe veri kümelerinin performansı artırılmaya çalışıldı. Deneylerde birçok doğal dil işleme yöntemi kullanıldı. Tokenizasyon için literatürdeki yeni yöntemler kıyaslanarak Türkçe diline uygulandı. Bu yöntemlerin hem Türkçe hem de İngilizce veri kümelerine etkisi gözlemlendi. SWDA test kümesinde %75.22 sınıflandırma başarısı elde edilerek literatürdeki en iyi yöntemlerin üzerine çıkıldı. XNLI İngilizce test kümesinde %86.35 ve Türkçe veri kümesinde %79.85 doğal dil çıkarımı başarısı elde edildi.

Özet (Çeviri)

In this work, we have studied the available intent classification and response selection methods for designing a customer service chatbot in Turkish language. We have compared the available chatbot types in the literature. As our main focus is the methods that are easy to adapt and implement, we decided to work on closed domain, task oriented, retrieval based type chatbot, as it suited best to our application. We have compared two implementation alternatives, i.e. intent classification and response selection. Moreover, the effect of including the history of the dialog to the training is experimented. We have suggested a classification method for labeled datasets using Natural Language Inference. As Turkish is an agglutinative language, most of the available methods in the literature does not perform as good as with languages like English. Therefore, we have conducted experiments with different neural network models to observe and compare their performances on various datasets. We compared the performance of state of the arts methods and analyzed the performance of pretrained language models on classification and natural language inference tasks. We have studied the factors that makes the performance of Turkish datasets lower than English datasets and defined basic problems. Then we tried to improve the performance of available methods on Turkish dataset by suggesting solutions to these problems. We have used many Natural Language Processing methods in our experiments. For tokenization specifically, we compared recent methods in the literature and applied to Turkish language. We experimented the effect of these methods on both Turkish and English datasets. In the SWDA dataset, we have obtained 75.22% classification accuracy on test set and introduced new state of the art. In the XNLI corpus, we have obtained 86.35% NLI accuracy on English test set and 79.85% on the Turkish test set.

Benzer Tezler

Tez No
75564
İnşaat firmalarında bilgi yönetimi
Başlık çevirisi yok
AHMET ALTUNBAŞ
Yüksek Lisans
Türkçe
1998
Mimarlık İstanbul Teknik Üniversitesi
Bina Yapım Yönetimi Bilim Dalı
PROF. DR. YILDIZ SEY
Tez No
104110
Ana kuruluş ile perakandeci mağazalar arasındaki tam zamanında bilgi ve belge akışının incelenmesi ve değerlendirilmesi
Examination and evaluation of just-in time information and documents flow between stores and head office in a retail company
FATMA DİDEM ÇÖKEM
Yüksek Lisans
Türkçe
2001
İşletme İstanbul Teknik Üniversitesi
PROF. DR. SITKI GÖZLÜ
Tez No
97124
Bankacılıkta değişim yönetimi
Change management in banking
AYDIN ARGIN
Doktora
Türkçe
2000
Bankacılık Marmara Üniversitesi
Bankacılık Ana Bilim Dalı
PROF. DR. NAZIM EKREN
Tez No
966083
Evaluation of retrieval augmented generation on various types of large language models
Çeşitli büyük dil modelleri üzerinde bilgi getirme destekli üretimin değerlendirilmesi
ÖMER KARTLI
Yüksek Lisans
İngilizce
2025
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol İstanbul Medipol Üniversitesi
Bilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. SELİM AKYOKUŞ
DR. ÖĞR. ÜYESİ SALİH SARP
Tez No
418978
Flight deck centered cost efficient 4D trajectory planning
Kokpit otomasyonu tabanlı 4D rota planlaması
MEVLÜT UZUN
Yüksek Lisans
İngilizce
2015
Havacılık Mühendisliği İstanbul Teknik Üniversitesi
Uçak ve Uzay Mühendisliği Ana Bilim Dalı
PROF. DR. GÖKHAN İNALHAN

Geri Dön