Translating natural language into qualitative sql search queries with multi agent large language models
Çoklu etmen büyük dil modelleri ile doğal dilin niteliksel sql arama sorgularına dönüştürülmesi
- Tez No: 958118
- Danışmanlar: PROF. DR. TOLGA AYAV
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2025
- Dil: İngilizce
- Üniversite: İzmir Yüksek Teknoloji Enstitüsü
- Enstitü: Lisansüstü Eğitim Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
- Sayfa Sayısı: 77
Özet
Doğal dilden SQL'e dönüşüm (NL2SQL), kullanıcı tarafından doğal dilde ifade edilen sorguların, aynı anlamı taşıyan yapısal SQL ifadelerine çevrilmesi sürecidir. Bu işlem, uzmanlık seviyesinde SQL bilgisi gerektirir, veri bilimciler ya da iş analistleri tarafından manuel olarak gerçekleştirildiğinde zaman alıcı olabilir. Bu süreci hızlandırmak ve kolaylaştırmak için araştırmacılar, veritabanlarıyla doğal dil üzerinden iletişimi mümkün kılacak yöntemler üzerine çalışmış; kullanıcılarla veri sistemleri arasında etkili bir arayüz oluşturmayı hedeflemişlerdir. Yaklaşık otuz yıllık bir süreçte, bu alandaki yaklaşımlar, kural tabanlı gramer sistemlerinden, veritabanı bilgisinin kodlandığı (database-aware encoding) seq2seq modellere evrilmiştir. Ancak, büyük dil modellerinin (LLM'ler) ortaya çıkmasıyla birlikte bu alanda kaydedilen ilerleme önemli ölçüde hızlanmış ve daha önce ulaşılamayan bir seviyeye erişmiştir. Bu çalışmada, NL2SQL görevi, GPT gibi büyük ölçekli modellere güvenmek yerine, orta ölçekli açık kaynak dil modellerinin etkin akıl yürütme gücünden ve işbirliğinden yararlanılarak ele alınmaya çalışılmıştır. Çalışmanın amacı, çok daha az kaynak gerektiren modellerle rekabetçi bir performansın elde edilip edilemeyeceğini araştırmaktır. Bu araştırma kapsamında, üç orta ölçekli açık kaynak model — Gemma3-IT (Google), Qwen2.5 Instruct (Alibaba) ve Mistral Nemo (Mistral AI) — kullanıldı. Hem modellerin iş birliğinden ve hem de bağlamsal veritabanı içeriğinden yararlanılarak, Spider geliştirme değerlendirme setinde %81,3 yürütme doğruluğuna ulaşıldı. Bu sonuç, her bir modelin bireysel performansının üzerinde olup, C3-SQL'e kıyasla yalnızca %0,6 ve DIN-SQL'e kıyasla %1,5 daha düşüktür. Sonuçlar, çalışmanın ortaya koyduğu yaklaşımın etkinliğini göstermektedir.
Özet (Çeviri)
Natural Language to SQL (NL2SQL), also known as text-to-SQL, refers to the task of converting natural language questions into equivalent SQL queries. This process traditionally requires specialized SQL knowledge and can be time-consuming when performed manually by data scientists. To address this challenge, researchers have investigated methods for enabling natural language communication with databases, aiming to establish an effective interface that serves as a bridge between users and data systems. Automating NL2SQL tasks has the potential to accelerate data-driven decision-making by streamlining the data retrieval process. Over around thirty years, approaches have evolved from rule-based grammar systems to database-aware sequence-to-SQL models. However, with the emergence of large language models (LLMs), progress in this field has significantly accelerated, achieving breakthroughs that were previously unattainable. In this study, NL2SQL task is attempted to be addressed by leveraging the joint reasoning power of mid-sized context-aware open language models, rather than relying on large-scale models such as GPT. The objective is to explore whether competitive performance can be achieved using models that require significantly fewer computational resources. Three mid-sized open-source models — Gemma3-IT (Google), Qwen2.5 Instruct (Alibaba) and Mistral Nemo (Mistral AI) — are utilized as the base models in this research, and it achieved an execution accuracy of 81.3% on the Spider development evaluation set by harnessing their collaborative work, slightly lower than two baseline studies, by just 0.6% compared to C3-SQL and 1.5% compared to DIN-SQL, indicating the effectiveness of this approach.
Benzer Tezler
- İmalat stratejileri ve imalat teknolojisi seçiminde uzman sistem yaklaşımı
Manufacturing strategies and an expert system approach to selecting manufacturing technology
İBRAHİM ÇİL
Doktora
Türkçe
1997
Endüstri ve Endüstri Mühendisliğiİstanbul Teknik ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
PROF. DR. RAMAZAN EVREN
- Parts-of-speech tagging of adverbs in the kyrgyz corpus
Kırgızca derlemdeki zarfların sözcük türü olarak işaretlenmesi
AİZHAN SATYBEKOVA
Yüksek Lisans
İngilizce
2023
Mütercim-TercümanlıkKırgızistan-Türkiye Manas ÜniversitesiMütercim Tercümanlık Ana Bilim Dalı
DOÇ. DR. AİDA KASİEVA
- Learning based image and video editing
Öğrenme temelli görüntü ve video düzenleme
LEVENT KARACAN
Doktora
İngilizce
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHacettepe ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. MEHMET ERKUT ERDEM
- A neorealist analysis of Iran-Russia relations: Tajik and Syrian civil wars
İran-Rusya ilişkilerinin neorealist bir analizi: Tacik ve Suriye iç savaşları
ESRA YANIK
Yüksek Lisans
İngilizce
2019
Uluslararası İlişkilerOrta Doğu Teknik ÜniversitesiOrtadoğu Araştırmaları Ana Bilim Dalı
DR. ÖĞR. ÜYESİ DERYA GÖÇER AKDER
DR. ZELAL ÖZDEMİR
- Improved fuzzy logic based edge detection method on clinical images
Klinik görüntülerde bulanık mantık temelli iyileştirilmiş kenar tespit yöntemi
MURAT MERT ÇELEN
Yüksek Lisans
İngilizce
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiKontrol ve Otomasyon Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ İLKER ÜSTOĞLU