Geri Dön

Domain-aware conversational open question answering for resource-constrained languages

Kaynak kısıtı olan diller için alan farkındalığına sahip sohbetsel serbest soru-cevaplama

  1. Tez No: 911086
  2. Yazar: EMRAH BUDUR
  3. Danışmanlar: PROF. DR. TUNGA GÜNGÖR
  4. Tez Türü: Doktora
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2024
  8. Dil: İngilizce
  9. Üniversite: Boğaziçi Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 180

Özet

Çok sayıda modern konuşma uygulamasının pazara girişi sadece kullanıcıların konuşmalı etkileşimler aracılığıyla bilgi arama talebini artırmakla kalmamış aynı zamanda Yapay Zeka destekli Sohbet Uygulamaları alanındaki araştırmalardaki yeniliklere de ivme kazandırmıştır. Alanında önemli ilerlemelere rağmen, bu ilerlemeler genellikle İngilizce dilinde sınırlı kalmıştır. Bu kısıtlama, gelişmiş modellerin büyük miktarda etiketlenmiş veri kümesine ihtiyaç duymasından kaynaklanmaktadır ve bu da sınırlı kaynaklara sahip dilleri göz ardı etmektedir. Bu tezde üç adımlı sistemli bir yaklaşımı takip ederek, Türkçe gibi kaynak kısıtlı dillerde güçlü Yapay Zeka destekli SSC sistemleri oluşturmanın zorluklarına değinmeyi, Yapay Zeka destekli Serbest Soru Cevap Sistemler (SSC) konusunda İngilizce ve kaynak kısıtlı diller arasındaki mesafeyi kapatmayı amaçlıyoruz. İlk adım olarak, İngilizce Doğal Dil Çıkarımı (DDÇ) veri kümelerini Türkçe'ye çevirmek için sinirsel makine çeviri (SMÇ) araçlarını kullanarak kaynak kısıtlı diller için sentetik veri kümeleri oluşturmak amacıyla uygun maliyetli bir yöntem öneriyoruz. İkinci adımda bu yaklaşımı Soru Cevaplama (QA) alanına genişleterek, sadece birkaç yüz etiketli örnekle bile kaynak kısıtlı diller için Serbest Soru Cevaplamanın (SSC) mümkün olduğunu gösteriyoruz. Son olarak, karşılıklı konuşma sinyallerini ve DDÇ modeli ile güçlendirilmiş bir Alan Dışı (OOD) algılayıcıyı da dahil ederek, gerçek dünya kullanım senaryolarıyla daha iyi uyum sağlayan bir Yapay Zeka destekli SSC sistemi olan BİRİ'yi geliştiriyoruz.

Özet (Çeviri)

The introduction of many modern conversational applications into the market not only increased the users' demand on information seeking through conversational interactions but also boosted the research-intensive innovations in the field of Conversational AI. Despite significant advancements in the field, the progress is mainly limited to the English language. This limitation is primarily attributed to the advanced models requiring large amounts of labeled datasets, hence, leaving languages with limited resources behind the scene. In this thesis, we aim to address challenges for building a robust Conversational OpenQA systems in resource-constrained languages like Turkish, and bridge the gap between a Conversational Open QA System in English and resource-constrained languages, by following a three-step systematic approach. As the first step, we propose a cost-effective method to generate synthetic datasets for resource-constrained languages by using neural machine translation (NMT) tools to translate English Natural Language Inference (NLI) datasets into Turkish. Extending this approach to Question Answering (QA) domain in the second step, we show that OpenQA is feasible for low-resource languages, even with only a few hundred labeled examples. Finally, by incorporating conversational signals as well as an Out-of-Domain detector enhanced by an NLI model, we develop BIRI, a Conversational OpenQA system, improving performance and aligning better with real-world use cases.

Benzer Tezler

  1. Gezgin haberleşme sistemleri için yalın zamanlama algoritması

    Lean scheduling algorithm for wireless communication

    MEHMET İZZET SAĞLAM

    Doktora

    Türkçe

    Türkçe

    2017

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    İletişim Sistemleri Ana Bilim Dalı

    PROF. DR. MESUT KARTAL

  2. Emotion aware artificial intelligence for cognitive systems

    Bilişsel sistemler için duygu farkındalıklı yapay zeka

    DEĞER AYATA

    Doktora

    İngilizce

    İngilizce

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. YUSUF YASLAN

    PROF. DR. MUSTAFA ERSEL KAMAŞAK

  3. Sosyal medya pazarlamasının X, Y ve Z jenerasyonlarının satın alma niyeti üzerindeki etkisi ve bir araştırma

    The effect of social media marketing on X, Y and Z generations' purchasing intention and a research

    BÜŞRA ŞENEL

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    İşletmeGalatasaray Üniversitesi

    İşletme Ana Bilim Dalı

    PROF. DR. ÖZGÜR ÇENGEL

  4. A domain aware genetic algorithm for optimum booster chlorination in water distribution systems

    İçme suyu dağıtım şebekelerinde optimum ara klorlama için alandan haberdar genetik algoritma

    MUSTAFA KEMAL PEKTÜRK

    Yüksek Lisans

    İngilizce

    İngilizce

    2010

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAtılım Üniversitesi

    Bilgisayar Mühendisliği Bölümü

    PROF. DR. SELÇUK SOYUPAK

    YRD. DOÇ. DR. HÜREVREN KILIÇ

  5. An ontology and conceptual graph based best matching algorithm for context-aware applications

    Bağlam farkındalıklı uygulamalar için ontoloji ve kavram çizgesi tabanlı en iyi eşleştirme algoritması

    REZA KOUSHAEİAN

    Yüksek Lisans

    İngilizce

    İngilizce

    2011

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik Üniversitesi

    Bilişim Sistemleri Bölümü

    YRD. DOÇ. DR. ALTAN KOÇYİĞİT