Geri Dön

Zero shot dialogue act classification

Sıfır atış diyalog sınıflandırması

  1. Tez No: 573363
  2. Yazar: İLİM UĞUR
  3. Danışmanlar: PROF. DR. GÖKTÜRK ÜÇOLUK
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2019
  8. Dil: İngilizce
  9. Üniversite: Orta Doğu Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 103

Özet

Birçok doğal dil işleme sorununa yönelik çözümler, öğrenilmesi için dile özgü etiketlenmiş verilere ihtiyaç duymaktadır. Bununla birlikte, hem yeni bir dilde yeni bir veri seti derlemek hem de mevcut bir veri setini başka bir dile tercüme etmek çabası, otomatikleştirilemeyecek bir uzman insan katkısını gerektirmektedir. Bu tez kapsamında, yeni bir hedef dilde bir veri kümesi olmaksızın o dildeki bir doğal dil işleme probleminin çözümünü öğrenebilmek kabiliyetini elde etmeyi araştırmakta ve bilinen bir problem olan diyalog sınıflandırma problemine odaklanmaktayız. Bu kapsamda, mevcut diyalog sınıflandırma yöntemlerini makine çevirisi teknikleri ile birleştiren, Yerelleştirilmiş Diyalog Sınıflandırıcısı (YEDİS) ve Evrensel Diyalog Sınıflandırıcısı (EDİS) adında iki çözüm önermekteyiz. Önerdiğimiz çözümler iki farklı diyalog eylem sınıflandırma yöntemi ve son teknoloji ürünü bir makine çevirisi yöntemi kullanarak uygulanıyor. Çözümleri, diyalog sınıflandırma yönteminin test edilmesinde sıklıkla kullanılan iki veri seti (SwDA ve MRDA) üzerinde, Almanca, İspanyolca ve Türkçe hedef dilleriyle test ediyoruz. Sonuçlar, çevrilen veri setleri üzerinde eğitilen modellerin, tercüme edilmemiş bir veri kümesi üzerinde eğitilen tek dilli eşlerine kıyasla daha kötü performans gösterdiğini belirtiyor. Yine de, sonuçlar aynı zamanda LDAC tarafından yeni hedef dillerde, bu dilde bir veri setine sahip olmadan, kabul edilebilir bir doğruluk oranıyla diyalog sınıflaması yapılabildiğini göstermektedir. Bu sonuçlar, önerdiğimiz otomatik veri kümesi çeviri yaklaşımının daha fazla araştırmaya değer olduğunu gösteriyor.

Özet (Çeviri)

Solutions to many natural language processing problems need language-specific labeled data to be learned. However, both the endeavor of compiling a new dataset in a new language and the practice of translating an existing dataset to another language require human expert effort which can not be automated. To learn a solution in a new target language in an automated manner without any extra data, we focus on the known problem of dialogue act classification and propose two solutions that combine existing dialogue act classification methods with machine translation techniques. We implement the proposed solutions Localized Dialogue Act Classifier (LDAC) and Universal Dialogue Act Classifier (UDAC) using two different dialogue act classification methods, and a state-of-the-art machine translation method. We test both solutions on two datasets that are frequently used in testing a dialogue act classification method, namely Switchboard Dialogue Act (SwDA) and Meeting Recorder Dialogue Act (MRDA) datasets, and use German, Spanish and Turkish as the target languages. The results show that the models trained on translated datasets perform worse than their monolingual counterparts, trained on a dataset in its original language. Nonetheless, the results also indicate that acceptably accurate dialogue act classification is achieved on new target languages by LDAC, without having a dataset in that language. These results show that the automated dataset translation idea we propose deserves further exploration.

Benzer Tezler

  1. Zero-shot and few-shot named entity recognition in environmental sciences domain

    Çevre bilimleri alanında sıfır-örnekli ve az-örnekli adlandırılmış varlık tanıma

    KEREM MERT DEMİRTAŞ

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolÇankaya Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ SERDAR ARSLAN

  2. Generalized zero-shot object recognition without class-attribute relations

    Sınıf-nitelik ilişkileri gerektirmeyen genelleştirilmiş sıfır-örnekli nesne tanıma

    MÜSLÜM ERSEL ER

    Yüksek Lisans

    İngilizce

    İngilizce

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ RAMAZAN GÖKBERK CİNBİŞ

  3. Deepkinzero: Zero-shot learning for predicting kinase phosphorylation sites

    Deepkinzero: Kinaz fosforilasyon yerlerinin sıfır örnek öğrenim ile tahmini

    IMAN DEZNABI

    Yüksek Lisans

    İngilizce

    İngilizce

    2018

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİhsan Doğramacı Bilkent Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    Assist. Prof. Dr. ABDULLAH ERCÜMENT ÇİÇEK

    Assist. Prof. Dr. ÖZNUR TAŞTAN OKAN

  4. Evaluating zero-shot learning capabilities of vision-language models

    Görme-dil modellerinin sıfır-örnekle öğrenme yeteneklerinin değerlendirilmesi

    MUSTAFA DOĞAN

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHacettepe Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. MEHMET ERKUT ERDEM

  5. Infrared domain adaptation with zero-shot quantization

    Veri gerektirmeyen nicelemenin kızılötesi alana uyarlaması

    BURAK SEVSAY

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik Üniversitesi

    Modelleme ve Simülasyon Ana Bilim Dalı

    YRD. DOÇ. DR. ERDEM AKAGÜNDÜZ