Geri Dön

Automated response generation for corporate chatbot systems

Kurumsal chatbot sistemleri için otomatik cevap üretme

  1. Tez No: 632801
  2. Yazar: ABDULLAH ŞAMİL GÜSER
  3. Danışmanlar: PROF. DR. MUSTAFA LEVENT ARSLAN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bankacılık, Dilbilim, Elektrik ve Elektronik Mühendisliği, Banking, Linguistics, Electrical and Electronics Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2020
  8. Dil: İngilizce
  9. Üniversite: Boğaziçi Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Elektrik ve Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Elektrik Elektronik Mühendisliği Bilim Dalı
  13. Sayfa Sayısı: 86

Özet

Bu çalışmada Türkçe dilinde müşteri hizmetleri chatbotu tasarımı için halihazır- daki niyet sınıflandırma ve cevap seçimi metotları üzerinde çalışıldı. Literatürdeki chatbot tipleri karşılaştırıldı. İmplementasyonu ve uyarlanması kolay yöntemler üzerine odaklanıldığı ve çalışmanın uygulama alanına uyduğu için kapalı alan, görev yönelimli, seçim tabanlı tipteki chatbotlar üzerinde çalışıldı. Niyet sınıflandırma ve cevap seçme olmak üzere iki farklı implementasyon alternatifi karşılaştırıldı. Diyalog geçmişini eğitime dahil etmenin etkisi gözlemlendi. Etiketli veriler için Doğal Dil Çıkarımı yöntemi kullanarak yeni bir sınıflandırma yöntemi önerildi. Türkçe bitişimli bir dil olduğu için literatürdeki hazır yöntemlerin birçoğu İngilizce verilerde olduğu kadar iyi çalışmamaktadır. Bundan dolayı, farklı yapay sinir ağı modelleriyle bu yöntemlerin farklı datasetlerdeki performansları kıyaslandı. En iyi yöntemlerin ve ön-eğitilmiş dil modellerinin sınıflandırma ve doğal dil çıkarımı problemlerindeki performansları incelendi. Türkçe veri kümelerindeki başarının İngilizce'dekine göre düşük çıkmasına sebep olan faktörler üzerinde çalışıldı ve birkaç temel problem tanımlandı. Daha sonra bu problemlere çözümler önerilerek Türkçe veri kümelerinin performansı artırılmaya çalışıldı. Deneylerde birçok doğal dil işleme yöntemi kullanıldı. Tokenizasyon için literatürdeki yeni yöntemler kıyaslanarak Türkçe diline uygulandı. Bu yöntemlerin hem Türkçe hem de İngilizce veri kümelerine etkisi gözlemlendi. SWDA test kümesinde %75.22 sınıflandırma başarısı elde edilerek literatürdeki en iyi yöntemlerin üzerine çıkıldı. XNLI İngilizce test kümesinde %86.35 ve Türkçe veri kümesinde %79.85 doğal dil çıkarımı başarısı elde edildi.

Özet (Çeviri)

In this work, we have studied the available intent classification and response selection methods for designing a customer service chatbot in Turkish language. We have compared the available chatbot types in the literature. As our main focus is the methods that are easy to adapt and implement, we decided to work on closed domain, task oriented, retrieval based type chatbot, as it suited best to our application. We have compared two implementation alternatives, i.e. intent classification and response selection. Moreover, the effect of including the history of the dialog to the training is experimented. We have suggested a classification method for labeled datasets using Natural Language Inference. As Turkish is an agglutinative language, most of the available methods in the literature does not perform as good as with languages like English. Therefore, we have conducted experiments with different neural network models to observe and compare their performances on various datasets. We compared the performance of state of the arts methods and analyzed the performance of pretrained language models on classification and natural language inference tasks. We have studied the factors that makes the performance of Turkish datasets lower than English datasets and defined basic problems. Then we tried to improve the performance of available methods on Turkish dataset by suggesting solutions to these problems. We have used many Natural Language Processing methods in our experiments. For tokenization specifically, we compared recent methods in the literature and applied to Turkish language. We experimented the effect of these methods on both Turkish and English datasets. In the SWDA dataset, we have obtained 75.22% classification accuracy on test set and introduced new state of the art. In the XNLI corpus, we have obtained 86.35% NLI accuracy on English test set and 79.85% on the Turkish test set.

Benzer Tezler

  1. İnşaat firmalarında bilgi yönetimi

    Başlık çevirisi yok

    AHMET ALTUNBAŞ

    Yüksek Lisans

    Türkçe

    Türkçe

    1998

    Mimarlıkİstanbul Teknik Üniversitesi

    Bina Yapım Yönetimi Bilim Dalı

    PROF. DR. YILDIZ SEY

  2. Ana kuruluş ile perakandeci mağazalar arasındaki tam zamanında bilgi ve belge akışının incelenmesi ve değerlendirilmesi

    Examination and evaluation of just-in time information and documents flow between stores and head office in a retail company

    FATMA DİDEM ÇÖKEM

    Yüksek Lisans

    Türkçe

    Türkçe

    2001

    İşletmeİstanbul Teknik Üniversitesi

    PROF. DR. SITKI GÖZLÜ

  3. Bankacılıkta değişim yönetimi

    Change management in banking

    AYDIN ARGIN

    Doktora

    Türkçe

    Türkçe

    2000

    BankacılıkMarmara Üniversitesi

    Bankacılık Ana Bilim Dalı

    PROF. DR. NAZIM EKREN

  4. Flight deck centered cost efficient 4D trajectory planning

    Kokpit otomasyonu tabanlı 4D rota planlaması

    MEVLÜT UZUN

    Yüksek Lisans

    İngilizce

    İngilizce

    2015

    Havacılık Mühendisliğiİstanbul Teknik Üniversitesi

    Uçak ve Uzay Mühendisliği Ana Bilim Dalı

    PROF. DR. GÖKHAN İNALHAN

  5. Recursive spline trajectory generation and automated cycle time prediction

    Başlık çevirisi yok

    ATAKAN ZEYBEK

    Yüksek Lisans

    İngilizce

    İngilizce

    2021

    Makine MühendisliğiThe University of British Columbia

    DR. YUSUF ALTİNTAS

    DR. MİNKYUN NOH