Geri Dön

A step towards automated database design: creating create queries using deep neural networks

Otomatik veritabanı tasarımına doğru bir adım: derin sinir ağlarını kullanarak oluştur sorguları oluşturma

  1. Tez No: 653769
  2. Yazar: SÜLEYMAN NAZMİ DİKER
  3. Danışmanlar: DR. ÖĞR. ÜYESİ CEMAL OKAN ŞAKAR
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2020
  8. Dil: İngilizce
  9. Üniversite: Bahçeşehir Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Büyük Veri Analitiği ve Yönetimi Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 78

Özet

Metinden SQL'e, doğal dil ifadelerini yapılandırılmış sorgu diliyle (SQL) eşleştirme görevidir. Önceki çalışmalar, bu görevin bilgi alma yönüne odaklanmaktadır. Bu yazıda, metinden-SQL çalışmalarına, doğal dilden veritabanı oluşturabildikleri yeni bir kullanım alanı sunuyoruz. Bu amaçla, bu görev için oluşturulmuş ilk veri kümesini sunuyoruz. Ayrıca, üç modüler bileşenden oluşan bir çerçeve öneriyoruz: (1) bir sütunun veri türünü ve kısıtlamalarını öngören sınıflandırıcı bileşen, (2) tablolar arasında“yabancı anahtar”ilişkileri kuran kısıtlayıcı bileşen, (3) sorgu bileşeni bir yuva doldurma yaklaşımı ile bir dizi“oluşturma”sorgusu oluşturur. Ancak bildiğimiz kadarıyla bu konuda daha önce yapılmış bir çalışma yoktur; bu nedenle, sınıflandırıcı bileşenini farklı açılardan değerlendirmek için çeşitli temel modeller öneriyoruz. Her model, tablo oluşturma görevindeki bağlamsal kelime temsillerini değerlendirmemizi sağlayan, son teknoloji, önceden eğitilmiş bir dil modeline dayanmaktadır. Deneyler, bu tür dilsel gösterimlerin, sütun veri türlerini ve kısıtlamalarını doğru bir şekilde sınıflandırmada hayati bir rol oynadığını göstermektedir. Önceden eğitilmiş modellerin dezavantajlarından biri eğitim süresi ve model boyutudur. Sonuç olarak deneyimiz, sınıflandırıcı bileşeninde çok görevli bir BERT (Devlin et al., 2018) kullanmanın her iki sorunu da etkili bir şekilde ele aldığını ortaya koymaktadır.

Özet (Çeviri)

Text-to-SQL is the task of mapping natural language utterances to structured query language (SQL). Prior studies focus on information retrieval aspect of this task. In this paper, we demonstrate a new use case for the text-to-SQL studies where a user can create database models from natural language and introduce the first dataset for this task. Furthermore, we propose a framework that consists of three modular components: (1) classifier component which predicts the data type and constraints of a column, (2) constraint component which establishes“foreign key”relationships between tables, (3) query component which generates a series of“create”queries through a slot-filling approach. However, as far as we know, there are no prior works on this topic; therefore, we propose various baseline models to evaluate the classifier component in different aspects. Each model is based on a state-of-the-art pre-trained language model that allows us to assess contextualized word representations in the table creation task. Experiments show that such representations play a vital role in classifying column data types and constraints correctly. One of the downsides of pre-trained models is the training time and the model size. Consequently, our experiment yields that using a multi-task BERT in the classifier component effectively addresses both problems.

Benzer Tezler

  1. Yerleşim sınıfı için çoklu gösterim veritabanının oluşturulması: Gösterim seviyelerini türetme, obje eşleştirme, güncelleme

    Creating multiple representation database for population class: Deriving representation levels, object matching, updating

    OSMAN NURİ ÇOBANKAYA

    Doktora

    Türkçe

    Türkçe

    2015

    Jeodezi ve Fotogrametriİstanbul Teknik Üniversitesi

    Geomatik Mühendisliği Ana Bilim Dalı

    PROF. DR. NESİBE NECLA ULUĞTEKİN

  2. İmalat stratejileri ve imalat teknolojisi seçiminde uzman sistem yaklaşımı

    Manufacturing strategies and an expert system approach to selecting manufacturing technology

    İBRAHİM ÇİL

    Doktora

    Türkçe

    Türkçe

    1997

    Endüstri ve Endüstri Mühendisliğiİstanbul Teknik Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    PROF. DR. RAMAZAN EVREN

  3. Teknolojik gelişmelerin ve rekabetçi pazar yapısının ürün ve proses tasarımına etkileri ve sektörel boyutta bir çalışma

    The Effects of technological innovations and competitive market structure on product and process design and a study in the industry

    MEHMET HAMDİ DABAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2001

    İşletmeİstanbul Teknik Üniversitesi

    İşletme Ana Bilim Dalı

    Y.DOÇ.DR. TİJEN ERTAY

  4. PC ler arasında veri iletişimini sağlayan bir yazılım

    A Software about data communication between PCs

    OSMAN NURİ ÖZPINAR

  5. Kaynak kısıtlı proje planlamada yöntemler ve uygulamalar

    Methods and applications in resource constrainet project planning

    F. ATİLLA DİREN

    Yüksek Lisans

    Türkçe

    Türkçe

    1991

    Endüstri ve Endüstri Mühendisliğiİstanbul Teknik Üniversitesi

    PROF.DR. ATAÇ SOYSAL