Automated response generation for corporate chatbot systems
Kurumsal chatbot sistemleri için otomatik cevap üretme
- Tez No: 632801
- Danışmanlar: PROF. DR. MUSTAFA LEVENT ARSLAN
- Tez Türü: Yüksek Lisans
- Konular: Bankacılık, Dilbilim, Elektrik ve Elektronik Mühendisliği, Banking, Linguistics, Electrical and Electronics Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2020
- Dil: İngilizce
- Üniversite: Boğaziçi Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Elektrik ve Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Elektrik Elektronik Mühendisliği Bilim Dalı
- Sayfa Sayısı: 86
Özet
Bu çalışmada Türkçe dilinde müşteri hizmetleri chatbotu tasarımı için halihazır- daki niyet sınıflandırma ve cevap seçimi metotları üzerinde çalışıldı. Literatürdeki chatbot tipleri karşılaştırıldı. İmplementasyonu ve uyarlanması kolay yöntemler üzerine odaklanıldığı ve çalışmanın uygulama alanına uyduğu için kapalı alan, görev yönelimli, seçim tabanlı tipteki chatbotlar üzerinde çalışıldı. Niyet sınıflandırma ve cevap seçme olmak üzere iki farklı implementasyon alternatifi karşılaştırıldı. Diyalog geçmişini eğitime dahil etmenin etkisi gözlemlendi. Etiketli veriler için Doğal Dil Çıkarımı yöntemi kullanarak yeni bir sınıflandırma yöntemi önerildi. Türkçe bitişimli bir dil olduğu için literatürdeki hazır yöntemlerin birçoğu İngilizce verilerde olduğu kadar iyi çalışmamaktadır. Bundan dolayı, farklı yapay sinir ağı modelleriyle bu yöntemlerin farklı datasetlerdeki performansları kıyaslandı. En iyi yöntemlerin ve ön-eğitilmiş dil modellerinin sınıflandırma ve doğal dil çıkarımı problemlerindeki performansları incelendi. Türkçe veri kümelerindeki başarının İngilizce'dekine göre düşük çıkmasına sebep olan faktörler üzerinde çalışıldı ve birkaç temel problem tanımlandı. Daha sonra bu problemlere çözümler önerilerek Türkçe veri kümelerinin performansı artırılmaya çalışıldı. Deneylerde birçok doğal dil işleme yöntemi kullanıldı. Tokenizasyon için literatürdeki yeni yöntemler kıyaslanarak Türkçe diline uygulandı. Bu yöntemlerin hem Türkçe hem de İngilizce veri kümelerine etkisi gözlemlendi. SWDA test kümesinde %75.22 sınıflandırma başarısı elde edilerek literatürdeki en iyi yöntemlerin üzerine çıkıldı. XNLI İngilizce test kümesinde %86.35 ve Türkçe veri kümesinde %79.85 doğal dil çıkarımı başarısı elde edildi.
Özet (Çeviri)
In this work, we have studied the available intent classification and response selection methods for designing a customer service chatbot in Turkish language. We have compared the available chatbot types in the literature. As our main focus is the methods that are easy to adapt and implement, we decided to work on closed domain, task oriented, retrieval based type chatbot, as it suited best to our application. We have compared two implementation alternatives, i.e. intent classification and response selection. Moreover, the effect of including the history of the dialog to the training is experimented. We have suggested a classification method for labeled datasets using Natural Language Inference. As Turkish is an agglutinative language, most of the available methods in the literature does not perform as good as with languages like English. Therefore, we have conducted experiments with different neural network models to observe and compare their performances on various datasets. We compared the performance of state of the arts methods and analyzed the performance of pretrained language models on classification and natural language inference tasks. We have studied the factors that makes the performance of Turkish datasets lower than English datasets and defined basic problems. Then we tried to improve the performance of available methods on Turkish dataset by suggesting solutions to these problems. We have used many Natural Language Processing methods in our experiments. For tokenization specifically, we compared recent methods in the literature and applied to Turkish language. We experimented the effect of these methods on both Turkish and English datasets. In the SWDA dataset, we have obtained 75.22% classification accuracy on test set and introduced new state of the art. In the XNLI corpus, we have obtained 86.35% NLI accuracy on English test set and 79.85% on the Turkish test set.
Benzer Tezler
- İnşaat firmalarında bilgi yönetimi
Başlık çevirisi yok
AHMET ALTUNBAŞ
Yüksek Lisans
Türkçe
1998
Mimarlıkİstanbul Teknik ÜniversitesiBina Yapım Yönetimi Bilim Dalı
PROF. DR. YILDIZ SEY
- Ana kuruluş ile perakandeci mağazalar arasındaki tam zamanında bilgi ve belge akışının incelenmesi ve değerlendirilmesi
Examination and evaluation of just-in time information and documents flow between stores and head office in a retail company
FATMA DİDEM ÇÖKEM
- Flight deck centered cost efficient 4D trajectory planning
Kokpit otomasyonu tabanlı 4D rota planlaması
MEVLÜT UZUN
Yüksek Lisans
İngilizce
2015
Havacılık Mühendisliğiİstanbul Teknik ÜniversitesiUçak ve Uzay Mühendisliği Ana Bilim Dalı
PROF. DR. GÖKHAN İNALHAN
- Recursive spline trajectory generation and automated cycle time prediction
Başlık çevirisi yok
ATAKAN ZEYBEK
Yüksek Lisans
İngilizce
2021
Makine MühendisliğiThe University of British ColumbiaDR. YUSUF ALTİNTAS
DR. MİNKYUN NOH