Turkish spoken question answering: Data generation and performance evaluation
Türkçe sesli soru cevaplama: Veri üretimi ve performans değerlendirmesi
- Tez No: 880263
- Danışmanlar: PROF. DR. MURAT SARAÇLAR, DOÇ. DR. EBRU ARISOY SARAÇLAR
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2024
- Dil: İngilizce
- Üniversite: Boğaziçi Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Sistem ve Kontrol Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 73
Özet
Türkçe veri üzerinde eğitilmiş sözlü soru cevaplama makine öğrenmesi modelleri üzerine yapılan çalışmalar literatürde çok fazla yer kaplamamaktadır. Bu araştırma, Türkçe sözlü soru cevaplama sistemlerinin geliştirilmesi ve değerlendirilmesi üzerine yapılmış kapsamlı bir çalışmadır. Araştırmanın ana hedefi, otomatik soru cevap sistemlerinin sesli Türkçe verisini kavraması adına yapılan uyarlamaların zorluklarını ve yöntemlerini sistematik olarak incelemektir. Türkçe sesli soru cevap açık kaynak veri setlerinin eksikliğinden ötürü, bu çalışmada ilk olarak SQuAD 2.0'ın makine çevirisi versiyonu olan SQuAD-TR ve XQuAD'ın Türkçe bölümünden türetilen, hem gerçek konuşmacılar hem de yazıdan konuşma üretebilen yapay zeka modelleri kullanılarak veri setleri oluşturulmuştur. Bu veri seti oluşturma süreci de kapsamlı bir Türkçe metin standardizasyonu ve metinden konuşma üreten modellerin entegrasyonunu da içermektedir. Araştırma, en güncel konuşma tanıma modellerinin ince ayarının yapılıp değerlendirilmesi süreci ile devam eder. Bu süreç, Türkçe konuşulan soru cevaplama verilerini doğru bir şekilde yorumlayıp işleyebilen sağlam bir otomatik soru cevaplama modelinin geliştirilmesi ile birleştirilmiştir. Araştırma, çeşitli konuşma ve metin tabanlı soru cevaplama veri setlerinde konuşulan soru cevaplama sisteminin genel performansının kapsamlı bir değerlendirilmesi ile sonuçlanır. Bu çalışma, çok dilli bir bağlamda sesli soru cevaplama sistemlerinin anlaşılmasını geliştirmekle kalmaz, aynı zamanda Türkçe dil işlemeyle ilgili önemli içgörüler ve ilerlemeler sunar, böylece çok dilli doğal dil işleme alanına katkıda bulunur.
Özet (Çeviri)
This research is a comprehensive study on the development and evaluation of spoken question answering (SQA) in Turkish. The study systematically examines the challenges and methods involved in adapting question answering (QA) systems to process spoken data in Turkish. It begins with the generation of spoken datasets derived from the English to Turkish machine-translated version of the Stanford Question Answering Dataset (SQuAD) 2.0, called SQuAD-TR, and the Turkish split of Cross-lingual Question Answering Dataset (XQuAD), suitable for both natural and synthetic speech contexts. The basis for the creation of spoken datasets lies the integration of detailed text normalization and text-to-speech (TTS) systems. It continues with the iterative process of fine-tuning and evaluating various state-of-the-art automatic speech recognition (ASR) models in conjunction with the development of a robust QA model capable of accurately interpreting and processing Turkish spoken QA data. The research culminates in a comprehensive evaluation of the overall performance of the SQA system on various spoken and text-based QA datasets. This work not only improves the understanding of spoken QA systems in a multilingual context, but also provides important insights and advances specific to Turkish language processing, thus contributing to the broader field of multilingual natural language processing.
Benzer Tezler
- Content teachers perceptions of the academic aural-oral skills of post-preparatory school students at Anadolu University
Anadolu Üniversitei'ndeki öğretim elemanlarının yabancı dil hazırlık eğitimi sonrası öğrencilerin alan derslerindeki İngilizce konuşma ve dinleme becerilerine yönelik algılamaları
SERCAN SAĞLAM
Yüksek Lisans
İngilizce
2003
Eğitim ve Öğretimİhsan Doğramacı Bilkent ÜniversitesiYabancı Dil Olarak İngilizce Öğretimi Ana Bilim Dalı
DR. MARTİN J. ENDLEY
- F.Almanya ve Türkiye'de okul öncesi eğitimi alan 4-6 yaşlar arası Türk çocuklarının dil gelişim düzeylerinin karşılaştırılması
Başlık çevirisi yok
HATİCE POYRAZ
- Nature of literary discussions in an advanced-level foreign language literature course in a Turkish EFL setting
Başlık çevirisi yok
DOĞAN YÜKSEL
Doktora
İngilizce
2007
Eğitim ve ÖğretimFlorida State UniversityOrtaöğretim Alan Öğretmenliği Ana Bilim Dalı
PROF. DEBORAH J. HASSON
- Deep learning for question answering
Soru cevaplama sistemleri için derin öğrenme
MERVE ÜNLÜ
Yüksek Lisans
İngilizce
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. ARZUCAN ÖZGÜR TÜRKMEN
DR. ÖĞR. ÜYESİ EBRU ARISOY SARAÇLAR
- فعي اجلَامييه رييَفْس ت ِفي طُِبيَيألحْكَام القُرْآنمنسورة النساء إىل هناية سورة يوسفً(مجعا ً ودراسة)
Kurtubî'nin el-Cȃmi'u li-Ahkȃmi'l-Kur'ȃn Tefsiri bağlamında Funkulȃt-Cevabî Konuşma kavramı. (Nisȃ Sûresinden Yusuf Sûresinin sonuna kadar) toplayarak ve çalışarak
ALİ AHMED MAHMOOD ALSULTAN
Yüksek Lisans
Arapça
2023
DinÇankırı Karatekin ÜniversitesiTemel İslam Bilimleri Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ABDULSALAM YOUSUF ESSA AL-YAGOOB