Domain-aware conversational open question answering for resource-constrained languages
Kaynak kısıtı olan diller için alan farkındalığına sahip sohbetsel serbest soru-cevaplama
- Tez No: 911086
- Danışmanlar: PROF. DR. TUNGA GÜNGÖR
- Tez Türü: Doktora
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2024
- Dil: İngilizce
- Üniversite: Boğaziçi Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 180
Özet
Çok sayıda modern konuşma uygulamasının pazara girişi sadece kullanıcıların konuşmalı etkileşimler aracılığıyla bilgi arama talebini artırmakla kalmamış aynı zamanda Yapay Zeka destekli Sohbet Uygulamaları alanındaki araştırmalardaki yeniliklere de ivme kazandırmıştır. Alanında önemli ilerlemelere rağmen, bu ilerlemeler genellikle İngilizce dilinde sınırlı kalmıştır. Bu kısıtlama, gelişmiş modellerin büyük miktarda etiketlenmiş veri kümesine ihtiyaç duymasından kaynaklanmaktadır ve bu da sınırlı kaynaklara sahip dilleri göz ardı etmektedir. Bu tezde üç adımlı sistemli bir yaklaşımı takip ederek, Türkçe gibi kaynak kısıtlı dillerde güçlü Yapay Zeka destekli SSC sistemleri oluşturmanın zorluklarına değinmeyi, Yapay Zeka destekli Serbest Soru Cevap Sistemler (SSC) konusunda İngilizce ve kaynak kısıtlı diller arasındaki mesafeyi kapatmayı amaçlıyoruz. İlk adım olarak, İngilizce Doğal Dil Çıkarımı (DDÇ) veri kümelerini Türkçe'ye çevirmek için sinirsel makine çeviri (SMÇ) araçlarını kullanarak kaynak kısıtlı diller için sentetik veri kümeleri oluşturmak amacıyla uygun maliyetli bir yöntem öneriyoruz. İkinci adımda bu yaklaşımı Soru Cevaplama (QA) alanına genişleterek, sadece birkaç yüz etiketli örnekle bile kaynak kısıtlı diller için Serbest Soru Cevaplamanın (SSC) mümkün olduğunu gösteriyoruz. Son olarak, karşılıklı konuşma sinyallerini ve DDÇ modeli ile güçlendirilmiş bir Alan Dışı (OOD) algılayıcıyı da dahil ederek, gerçek dünya kullanım senaryolarıyla daha iyi uyum sağlayan bir Yapay Zeka destekli SSC sistemi olan BİRİ'yi geliştiriyoruz.
Özet (Çeviri)
The introduction of many modern conversational applications into the market not only increased the users' demand on information seeking through conversational interactions but also boosted the research-intensive innovations in the field of Conversational AI. Despite significant advancements in the field, the progress is mainly limited to the English language. This limitation is primarily attributed to the advanced models requiring large amounts of labeled datasets, hence, leaving languages with limited resources behind the scene. In this thesis, we aim to address challenges for building a robust Conversational OpenQA systems in resource-constrained languages like Turkish, and bridge the gap between a Conversational Open QA System in English and resource-constrained languages, by following a three-step systematic approach. As the first step, we propose a cost-effective method to generate synthetic datasets for resource-constrained languages by using neural machine translation (NMT) tools to translate English Natural Language Inference (NLI) datasets into Turkish. Extending this approach to Question Answering (QA) domain in the second step, we show that OpenQA is feasible for low-resource languages, even with only a few hundred labeled examples. Finally, by incorporating conversational signals as well as an Out-of-Domain detector enhanced by an NLI model, we develop BIRI, a Conversational OpenQA system, improving performance and aligning better with real-world use cases.
Benzer Tezler
- Gezgin haberleşme sistemleri için yalın zamanlama algoritması
Lean scheduling algorithm for wireless communication
MEHMET İZZET SAĞLAM
Doktora
Türkçe
2017
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesiİletişim Sistemleri Ana Bilim Dalı
PROF. DR. MESUT KARTAL
- Emotion aware artificial intelligence for cognitive systems
Bilişsel sistemler için duygu farkındalıklı yapay zeka
DEĞER AYATA
Doktora
İngilizce
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. YUSUF YASLAN
PROF. DR. MUSTAFA ERSEL KAMAŞAK
- Sosyal medya pazarlamasının X, Y ve Z jenerasyonlarının satın alma niyeti üzerindeki etkisi ve bir araştırma
The effect of social media marketing on X, Y and Z generations' purchasing intention and a research
BÜŞRA ŞENEL
- A domain aware genetic algorithm for optimum booster chlorination in water distribution systems
İçme suyu dağıtım şebekelerinde optimum ara klorlama için alandan haberdar genetik algoritma
MUSTAFA KEMAL PEKTÜRK
Yüksek Lisans
İngilizce
2010
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAtılım ÜniversitesiBilgisayar Mühendisliği Bölümü
PROF. DR. SELÇUK SOYUPAK
YRD. DOÇ. DR. HÜREVREN KILIÇ
- An ontology and conceptual graph based best matching algorithm for context-aware applications
Bağlam farkındalıklı uygulamalar için ontoloji ve kavram çizgesi tabanlı en iyi eşleştirme algoritması
REZA KOUSHAEİAN
Yüksek Lisans
İngilizce
2011
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik ÜniversitesiBilişim Sistemleri Bölümü
YRD. DOÇ. DR. ALTAN KOÇYİĞİT