Geri Dön

Turkish spoken question answering: Data generation and performance evaluation

Türkçe sesli soru cevaplama: Veri üretimi ve performans değerlendirmesi

  1. Tez No: 880263
  2. Yazar: ALİCAN ACAR
  3. Danışmanlar: PROF. DR. MURAT SARAÇLAR, DOÇ. DR. EBRU ARISOY SARAÇLAR
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2024
  8. Dil: İngilizce
  9. Üniversite: Boğaziçi Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Sistem ve Kontrol Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 73

Özet

Türkçe veri üzerinde eğitilmiş sözlü soru cevaplama makine öğrenmesi modelleri üzerine yapılan çalışmalar literatürde çok fazla yer kaplamamaktadır. Bu araştırma, Türkçe sözlü soru cevaplama sistemlerinin geliştirilmesi ve değerlendirilmesi üzerine yapılmış kapsamlı bir çalışmadır. Araştırmanın ana hedefi, otomatik soru cevap sistemlerinin sesli Türkçe verisini kavraması adına yapılan uyarlamaların zorluklarını ve yöntemlerini sistematik olarak incelemektir. Türkçe sesli soru cevap açık kaynak veri setlerinin eksikliğinden ötürü, bu çalışmada ilk olarak SQuAD 2.0'ın makine çevirisi versiyonu olan SQuAD-TR ve XQuAD'ın Türkçe bölümünden türetilen, hem gerçek konuşmacılar hem de yazıdan konuşma üretebilen yapay zeka modelleri kullanılarak veri setleri oluşturulmuştur. Bu veri seti oluşturma süreci de kapsamlı bir Türkçe metin standardizasyonu ve metinden konuşma üreten modellerin entegrasyonunu da içermektedir. Araştırma, en güncel konuşma tanıma modellerinin ince ayarının yapılıp değerlendirilmesi süreci ile devam eder. Bu süreç, Türkçe konuşulan soru cevaplama verilerini doğru bir şekilde yorumlayıp işleyebilen sağlam bir otomatik soru cevaplama modelinin geliştirilmesi ile birleştirilmiştir. Araştırma, çeşitli konuşma ve metin tabanlı soru cevaplama veri setlerinde konuşulan soru cevaplama sisteminin genel performansının kapsamlı bir değerlendirilmesi ile sonuçlanır. Bu çalışma, çok dilli bir bağlamda sesli soru cevaplama sistemlerinin anlaşılmasını geliştirmekle kalmaz, aynı zamanda Türkçe dil işlemeyle ilgili önemli içgörüler ve ilerlemeler sunar, böylece çok dilli doğal dil işleme alanına katkıda bulunur.

Özet (Çeviri)

This research is a comprehensive study on the development and evaluation of spoken question answering (SQA) in Turkish. The study systematically examines the challenges and methods involved in adapting question answering (QA) systems to process spoken data in Turkish. It begins with the generation of spoken datasets derived from the English to Turkish machine-translated version of the Stanford Question Answering Dataset (SQuAD) 2.0, called SQuAD-TR, and the Turkish split of Cross-lingual Question Answering Dataset (XQuAD), suitable for both natural and synthetic speech contexts. The basis for the creation of spoken datasets lies the integration of detailed text normalization and text-to-speech (TTS) systems. It continues with the iterative process of fine-tuning and evaluating various state-of-the-art automatic speech recognition (ASR) models in conjunction with the development of a robust QA model capable of accurately interpreting and processing Turkish spoken QA data. The research culminates in a comprehensive evaluation of the overall performance of the SQA system on various spoken and text-based QA datasets. This work not only improves the understanding of spoken QA systems in a multilingual context, but also provides important insights and advances specific to Turkish language processing, thus contributing to the broader field of multilingual natural language processing.

Benzer Tezler

  1. Content teachers perceptions of the academic aural-oral skills of post-preparatory school students at Anadolu University

    Anadolu Üniversitei'ndeki öğretim elemanlarının yabancı dil hazırlık eğitimi sonrası öğrencilerin alan derslerindeki İngilizce konuşma ve dinleme becerilerine yönelik algılamaları

    SERCAN SAĞLAM

    Yüksek Lisans

    İngilizce

    İngilizce

    2003

    Eğitim ve Öğretimİhsan Doğramacı Bilkent Üniversitesi

    Yabancı Dil Olarak İngilizce Öğretimi Ana Bilim Dalı

    DR. MARTİN J. ENDLEY

  2. Nature of literary discussions in an advanced-level foreign language literature course in a Turkish EFL setting

    Başlık çevirisi yok

    DOĞAN YÜKSEL

    Doktora

    İngilizce

    İngilizce

    2007

    Eğitim ve ÖğretimFlorida State University

    Ortaöğretim Alan Öğretmenliği Ana Bilim Dalı

    PROF. DEBORAH J. HASSON

  3. Deep learning for question answering

    Soru cevaplama sistemleri için derin öğrenme

    MERVE ÜNLÜ

    Yüksek Lisans

    İngilizce

    İngilizce

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ARZUCAN ÖZGÜR TÜRKMEN

    DR. ÖĞR. ÜYESİ EBRU ARISOY SARAÇLAR

  4. فعي اجلَامييه رييَفْس ت ِفي طُِبيَيألحْكَام القُرْآنمنسورة النساء إىل هناية سورة يوسفً(مجعا ً ودراسة)

    Kurtubî'nin el-Cȃmi'u li-Ahkȃmi'l-Kur'ȃn Tefsiri bağlamında Funkulȃt-Cevabî Konuşma kavramı. (Nisȃ Sûresinden Yusuf Sûresinin sonuna kadar) toplayarak ve çalışarak

    ALİ AHMED MAHMOOD ALSULTAN

    Yüksek Lisans

    Arapça

    Arapça

    2023

    DinÇankırı Karatekin Üniversitesi

    Temel İslam Bilimleri Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ABDULSALAM YOUSUF ESSA AL-YAGOOB