Geri Dön

Büyük dil modeli desteği ile doğal dilden SQL dönüşümü yapan sistem oluşturulması

Creating a natural language to SQL conversion system with large language model support

  1. Tez No: 957644
  2. Yazar: ALİ GALİP ÇINAR
  3. Danışmanlar: DOÇ. DR. BUKET DOĞAN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2025
  8. Dil: Türkçe
  9. Üniversite: Marmara Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
  13. Sayfa Sayısı: 60

Özet

Son yıllarda, dünyada üretilen veri miktarı ve bu verilerin işlenmesi ihtiyacı baş döndürücü bir hızla artmaktadır. Kurumlar ve bireyler, büyük veri tabanlarında depolanan bilgilere daha hızlı ve etkili bir şekilde erişmek istemekte; bu da veri tabanı yönetimi ve sorgulama süreçlerini her zamankinden daha önemli hale getirmektedir. Ancak, karmaşık SQL sorguları yazabilmek, çoğu kullanıcı için ciddi bir teknik engel oluşturmaktadır. Bu nedenle, kullanıcıların doğal dil ile veri tabanlarına kolayca erişebilmesini sağlayacak akıllı sistemlere olan ihtiyaç her geçen gün artmaktadır. Bu çalışmada, doğal dilde ifade edilen soruları otomatik olarak SQL sorgularına dönüştüren bir sistemin tasarımı, model eğitimi ve uygulaması gerçekleştirilmiştir. Sistem, farklı araştırma grupları tarafından geliştirilmiş ve farklı mimari yaklaşımları temsil eden üç büyük dil modeli kullanılarak oluşturulmuştur. Bu amaçla, Google tarafından geliştirilen ve yaklaşık 220 milyon parametreye sahip ön eğitimli T5-Base, Facebook/Meta tarafından geliştirilen 406 milyon parametreli ön eğitimli BART-Large ve Microsoft tarafından geliştirilen 400 milyon parametreli ön eğitimli ProphetNet modelleri kullanılmıştır. Bu modeller, Spider veri seti üzerinde özel olarak eğitilmiş; veri hazırlığı ve ince ayar süreçleri, bulut tabanlı cihazlar kullanılarak dikkatle yürütülmüştür. Geliştirilen uygulama sayesinde, kullanıcıların teknik bilgiye ihtiyaç duymadan veri tabanlarından sorgulama yapabilmesi amaçlanmıştır. Modellerin başarıları, Yürütme Doğruluğu (Execution Accuracy) ve BLEU Skor gibi ölçütlerle karşılaştırmalı olarak değerlendirilmiş ve hangi model mimarisinin Doğal Dil-Sql görevlerinde daha yüksek performans sunduğu ortaya konmuştur. Yapılan değerlendirmeler sonucunda, Bart-Large modeli, %45,00'lık bir Yürütme Doğruluğu (Execution Accuracy) ve %34,82'lik bir BLEU Skor elde ederek her iki metrikte de en yüksek başarıyı göstermiş ve tercih edilebilirlik açısından öne çıkmıştır. Onu, %35,00 Yürütme Doğruluğu (Execution Accuracy) ve %30,29 BLEU Skor ile T5- Base modeli takip etmiştir. İlginç bir bulgu olarak, ProphetNet modeli %34,00 ile T5- Base'e yakın bir yürütme doğruluğu sergilemesine rağmen, %4,25 gibi oldukça düşük bir BLEU skoru almıştır. Bu durum, ProphetNet'in anlamsal olarak doğru sonuçlar üretebilse de bunu referans sorgulardan sözdizimsel olarak oldukça farklı yapılarla başardığını göstermektedir. Çalışmanın sonunda hem model eğitimi hem de performans analizi açısından sistematik bir yapı ortaya konmuş; yapay zekanın veri tabanı sorgulamalarını daha erişilebilir kılmadaki gücü analiz edilmiştir. Elde edilen sonuçların, benzer çalışmalar yapacak araştırmacılar ve uygulayıcılar için önemli bir rehber niteliğinde olması hedeflenmiştir.

Özet (Çeviri)

In recent years, the amount of data produced worldwide and the need to process this data have increased at a staggering rate. Organizations and individuals now require faster and more effective access to information stored in large databases, making database management and query processes more crucial than ever. However, writing complex SQL queries remains a significant technical barrier for most users. Consequently, there is a growing demand for intelligent systems that enable users to interact with databases easily through natural language. In this study, the design, training, and implementation of a system that automatically converts natural language queries into SQL statements are presented. The system leverages three large language models, each representing different architectural approaches and developed by leading research groups. For this purpose, the pretrained T5-Base model developed by Google (with approximately 220 million parameters), BART-Large by Facebook/Meta (406 million parameters), and ProphetNet by Microsoft (400 million parameters) were utilized. These models were specifically fine-tuned on the Spider dataset, with data preparation and optimization processes meticulously carried out on high-performance cloud-based infrastructure. The developed application aims to allow users to query databases without requiring technical expertise. The performance of the models was comparatively evaluated using metrics such as Execution Accuracy and BLEU Score, revealing which model architecture provides superior results for NL-to-SQL tasks. The evaluation results revealed a clear performance hierarchy among the models. The Bart-Large model demonstrated superior performance, achieving the highest Skors across both metrics with an Execution Accuracy of 45% and a BLEU Score of 34.82%. The T5- Base model ranked second, with Skors of 35% and 30.29% respectively. Notably, a significant discrepancy was observed for the ProphetNet model; while its Execution Accuracy of 34% was comparable to that of T5-Base, its BLEU Score was substantially lower at 4.25%. This suggests that ProphetNet is capable of generating functionally correct queries through syntactic structures that diverge considerably from the reference examples. Ultimately, this study presents a systematic framework with technical and educational value, analyzing the effectiveness of state of the art artificial intelligence methods in making database queries more accessible. The findings are intended to serve as a valuable guide for researchers and practitioners pursuing similar work in this domain.

Benzer Tezler

  1. İnşaat sözleşmelerinde hak talebi yönetimi: Kamu projeleri için öneri model

    Claim management in construction contracts: Proposed model for public construction projects

    İSMAİL CENGİZ YILMAZ

    Doktora

    Türkçe

    Türkçe

    2013

    Mimarlıkİstanbul Teknik Üniversitesi

    Mimarlık Ana Bilim Dalı

    PROF. DR. HÜSEYİN ATİLLA DİKBAŞ

  2. Hakem atama otomasyonu için bir karar destek sistemi: Doğal dil işleme ve veri-güdümlü optimizasyon ile bütünleşik bir yaklaşım

    A decision support system for reviewer assignment automation: An integrated approach with natural language processing and data-driven optimization

    MELTEM AKSOY

    Doktora

    Türkçe

    Türkçe

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    DOÇ. DR. SEDA YANIK ÖZBAY

    PROF. DR. MEHMET FATİH AMASYALI

  3. A new framework for decentralized social networks: Harnessing blockchain, deep learning, and natural language processing

    Merkezsiz sosyal ağlar için yeni bir çerçeve: Blok zinciri, derin öğrenme ve doğal dil işlemeyi kullanmak

    AMIR AL KADAH

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSakarya Üniversitesi

    Yazılım Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ DENİZ BALTA

  4. A hybrid deep learning metaheuristic model for diagnosis of diabetic retinopathy

    Diyabetik retinopatinin tanısı için hibrit bir derin öğrenme meta-sezgisel modeli

    ÖMER FARUK GÜRCAN

    Doktora

    İngilizce

    İngilizce

    2022

    Endüstri ve Endüstri Mühendisliğiİstanbul Teknik Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ÖMER FARUK BEYCA

  5. Türkiye'de küçük ve orta ölçekli işletmelerin gelişme süreci ve Azerbaycan'daki durumla kıyaslanması

    Başlık çevirisi yok

    AİDA GAFFAROVA

    Yüksek Lisans

    Türkçe

    Türkçe

    2000

    İşletmeGazi Üniversitesi

    Dış Ticaret Eğitimi Bilim Dalı

    PROF. DR. İZZET GÜMÜŞ