Geri Dön

Transqlate: Translating natural language sentences to sql queries using transformers

Transqlate: Zenginleştirilmiş doğal dil cümlelerini transformerler kullanarak sql sorgularına çevirmek

  1. Tez No: 761581
  2. Yazar: MOUSA FARSHKAR AZARI
  3. Danışmanlar: PROF. DR. ÖZGÜR ULUSOY
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2022
  8. Dil: İngilizce
  9. Üniversite: İhsan Doğramacı Bilkent Üniversitesi
  10. Enstitü: Mühendislik ve Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 56

Özet

Farklı uygulamalara ait organizasyonların sahip olduğu yapılandırılmış verilerin büyük bir kısmı tipik olarak İlişkisel Veritabanı Yönetim Sistemlerinde depolanır ve ilişkisel veritabanlarından istenen bilgileri çıkarmak için iyi bir Yapılandırılmış Dil Sorgusu (SQL) bilgisi gerekir. Veritabanlarında yer alan bilgilere erişmesi gereken sıradan kullanıcılar erişim için gerekli beceri ve bilgiye sahip değildirler. Ayrıca, bazı uzman kullanıcılar bile veritabanını oluşturan şematik yapıları yete-rince bilmedikleri durumda karmaşık SQL sorguları oluşturmayı zor bulabilirler. Bu durum sonucunda, son zamanlarda kullanıcılar tarafından doğal dilde formüle edilen sorguların, veritabanı sistemleri tarafından işlenecek SQL sorgularına çevrilmesi için önemli miktarda araştırma yapılmaktadır. Bu tezde, doğal dilden SQL'e çeviride kullanılacak bazı derin akıllı stratejiler sunuyoruz. Veritabanları için Doğal Dil Arayüzü (NLIDB) sistemlerini daha etkin duruma getirebilmek amacıyla yeni bir yöntem olan TranSQLate'i öneriyoruz. Stratejilerimizi Vanilla ve T5 dönüştürücü modellerine üç farklı şekilde uyguluyoruz. Zenginleştirilmiş girdilerle, zenginleştirilmemiş versiyonlara kıyasla çeviri doğruluğunda %16,7, SacreBLEU skorunda 6,5 puan ve n-gram hassasiyetinde 18 puana varan iyileşme elde ediyoruz. Önerdiğimiz yöntem, IMDB, scholar ve Yelp veri kümeleri üzerinde çeviri doğruluğu açısından, son teknoloji sistemler NALIR, TEMPLAR ve DBTagger'da kullanılan stratejilere üstünlük sağlamaktadır

Özet (Çeviri)

A large amount of the structured data owned by different enterprises is typically stored in Relational Database Management Systems, and a decent knowledge of Structured Language Query (SQL) is required to extract desired information from the relational databases. Many naive users need to access the information from databases, and they do not have the necessary skills or knowledge. Additionally, even some expert users might find it challenging to provide complex SQL queries when they do not know the schema underlying the database. To this end, a considerable amount of research has been conducted recently for the translation of queries formulated by users in a natural language to SQL queries to be processed by database systems. In this thesis, we provide some deep intelligent strategies to be used in natural language to SQL translation. We propose TranSQLate, a novel method to enrich the input sequences and provide more effective Natural Language Interface to Database (NLIDB) systems. We apply our strategies to the Vanilla transformer and T5 transformer models in three different ways. With enriched inputs, we achieve up to 16.7% improvement in translation accuracy, 6.5 points in SacreBLEU score, and 18 points in the n-gram precision, compared to not enriched versions. Our method surpasses the strategies used in the state-of-the-art systems NALIR, TEMPLAR, and DBTagger, in terms of translation accuracy over IMDB, scholar, and Yelp datasets.

Benzer Tezler

  1. İngilizce'den Türkçe'ye istatistiksel bilgisayarlı çeviri sistemlerinde alan uyarlaması ile başarının artırılması

    Evaluation of domain adaptation approaches on English-to-Turkish statistical machine translation systems

    EZGİ YILDIRIM

    Yüksek Lisans

    Türkçe

    Türkçe

    2014

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. AHMET CÜNEYD TANTUĞ

  2. A prototype English-Turkish statistical machine translation system

    İngilizce-Türkçe istatistiksel bilgisayarlı çeviri sistemi prototipi

    İLKNUR DURGAR EL-KAHLOUT

    Doktora

    İngilizce

    İngilizce

    2009

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSabancı Üniversitesi

    Bilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı

    PROF. DR. KEMAL OFLAZER

  3. Türkçe doğal dil metinlerinden python programlama dili kodu üretilmesi

    Generation of python programming language code from Turkish natural language texts

    AYŞEGÜL HATİPOĞLU

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBursa Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. TURGAY TUGAY BİLGİN

  4. Makine çevirilerinde sorun teşkil eden eş yazımlı kelimeleri bulunduran ifadeler için bir kural tabanlı çeviri modeli çalışması

    A rule-based translation model for the phrases having homographs that cause difficulties in machine translation

    NEVZAT ÇAPOĞLU

    Doktora

    Türkçe

    Türkçe

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Sabahattin Zaim Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ YAHYA ŞİRİN

  5. Yazılı Türkçe dilinden Türk işaret diline (tid) makine çevirisi sistemi

    Text to sign language machine translation system for Turkish

    CİHAT ERYİĞİT

    Doktora

    Türkçe

    Türkçe

    2017

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. HATİCE KÖSE