Domain-aware conversational open question answering for resource-constrained languages
Kaynak kısıtı olan diller için alan farkındalığına sahip sohbetsel serbest soru-cevaplama
- Tez No: 911086
- Danışmanlar: PROF. DR. TUNGA GÜNGÖR
- Tez Türü: Doktora
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2024
- Dil: İngilizce
- Üniversite: Boğaziçi Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 180
Özet
Çok sayıda modern konuşma uygulamasının pazara girişi sadece kullanıcıların konuşmalı etkileşimler aracılığıyla bilgi arama talebini artırmakla kalmamış aynı zamanda Yapay Zeka destekli Sohbet Uygulamaları alanındaki araştırmalardaki yeniliklere de ivme kazandırmıştır. Alanında önemli ilerlemelere rağmen, bu ilerlemeler genellikle İngilizce dilinde sınırlı kalmıştır. Bu kısıtlama, gelişmiş modellerin büyük miktarda etiketlenmiş veri kümesine ihtiyaç duymasından kaynaklanmaktadır ve bu da sınırlı kaynaklara sahip dilleri göz ardı etmektedir. Bu tezde üç adımlı sistemli bir yaklaşımı takip ederek, Türkçe gibi kaynak kısıtlı dillerde güçlü Yapay Zeka destekli SSC sistemleri oluşturmanın zorluklarına değinmeyi, Yapay Zeka destekli Serbest Soru Cevap Sistemler (SSC) konusunda İngilizce ve kaynak kısıtlı diller arasındaki mesafeyi kapatmayı amaçlıyoruz. İlk adım olarak, İngilizce Doğal Dil Çıkarımı (DDÇ) veri kümelerini Türkçe'ye çevirmek için sinirsel makine çeviri (SMÇ) araçlarını kullanarak kaynak kısıtlı diller için sentetik veri kümeleri oluşturmak amacıyla uygun maliyetli bir yöntem öneriyoruz. İkinci adımda bu yaklaşımı Soru Cevaplama (QA) alanına genişleterek, sadece birkaç yüz etiketli örnekle bile kaynak kısıtlı diller için Serbest Soru Cevaplamanın (SSC) mümkün olduğunu gösteriyoruz. Son olarak, karşılıklı konuşma sinyallerini ve DDÇ modeli ile güçlendirilmiş bir Alan Dışı (OOD) algılayıcıyı da dahil ederek, gerçek dünya kullanım senaryolarıyla daha iyi uyum sağlayan bir Yapay Zeka destekli SSC sistemi olan BİRİ'yi geliştiriyoruz.
Özet (Çeviri)
The introduction of many modern conversational applications into the market not only increased the users' demand on information seeking through conversational interactions but also boosted the research-intensive innovations in the field of Conversational AI. Despite significant advancements in the field, the progress is mainly limited to the English language. This limitation is primarily attributed to the advanced models requiring large amounts of labeled datasets, hence, leaving languages with limited resources behind the scene. In this thesis, we aim to address challenges for building a robust Conversational OpenQA systems in resource-constrained languages like Turkish, and bridge the gap between a Conversational Open QA System in English and resource-constrained languages, by following a three-step systematic approach. As the first step, we propose a cost-effective method to generate synthetic datasets for resource-constrained languages by using neural machine translation (NMT) tools to translate English Natural Language Inference (NLI) datasets into Turkish. Extending this approach to Question Answering (QA) domain in the second step, we show that OpenQA is feasible for low-resource languages, even with only a few hundred labeled examples. Finally, by incorporating conversational signals as well as an Out-of-Domain detector enhanced by an NLI model, we develop BIRI, a Conversational OpenQA system, improving performance and aligning better with real-world use cases.
Benzer Tezler
- Optimizing medical dialogue systems with reinforcement learning from human feedback architectures
İnsan geri bildiriminden öğrenme mimarileriyle tıbbi diyalog sistemlerinin optimizasyonu
ABDUL REHMAN
Yüksek Lisans
İngilizce
2025
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Aydın ÜniversitesiYazılım Mühendisliği Ana Bilim Dalı
PROF. ALİ OKATAN
- Gezgin haberleşme sistemleri için yalın zamanlama algoritması
Lean scheduling algorithm for wireless communication
MEHMET İZZET SAĞLAM
Doktora
Türkçe
2017
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesiİletişim Sistemleri Ana Bilim Dalı
PROF. DR. MESUT KARTAL
- Emotion aware artificial intelligence for cognitive systems
Bilişsel sistemler için duygu farkındalıklı yapay zeka
DEĞER AYATA
Doktora
İngilizce
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. YUSUF YASLAN
PROF. DR. MUSTAFA ERSEL KAMAŞAK
- Generative AI in Healthcare: A Turkish Chatbot for Symptom Assesment and Tailored Recommendations
Sağlikta üretken yapay zekâ: semptom değerlendirmesi ve kişiye özel öneriler için Türkçe bir sohbet botu
YUNUS EMRE IŞIKDEMİR
Yüksek Lisans
İngilizce
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHacettepe ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. MURAT AYDOS
- Sosyal medya pazarlamasının X, Y ve Z jenerasyonlarının satın alma niyeti üzerindeki etkisi ve bir araştırma
The effect of social media marketing on X, Y and Z generations' purchasing intention and a research
BÜŞRA ŞENEL