Geri Dön

Enhancing retrieval-augmented generation accuracy with dynamic chunking and optimized vector search

Dinamik parçalama ve optimize edilmiş vektör araması ile bilgi getirme destekli üretim doğruluğunu artırma

  1. Tez No: 921425
  2. Yazar: DERYA TANYILDIZ
  3. Danışmanlar: PROF. DR. MEHMET FATİH AMASYALI, DOÇ. DR. SERKAN AYVAZ
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2025
  8. Dil: İngilizce
  9. Üniversite: Yıldız Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
  13. Sayfa Sayısı: 57

Özet

Erişim Destekli Üretim mimarileri, doğru, alakalı ve bağlama uygun yanıtlar üretmek için etkili bir geri getirme ve sıralama mekanizmasının sorunsuz entegrasyonuna dayanır. Bu çalışmada, bilgi geri getirme ve üretim tutarlılığına yönelik kritik zorlukları ele alan gelişmiş teknikleri kullanarak Erişim Destekli Üretim sistemlerinin yanıt performansını artırmak için kapsamlı bir yaklaşım öneriyoruz. Yöntemimiz, belgeleri uyarlanabilir şekilde segmente ederek bağlamsal tutarlılığı artıran ve bilgi parçalanmasını azaltan dinamik parçalama (dynamic chunking) yöntemini içermektedir. Anlamsal temsil oluşturma sürecinde, yüksek boyutlu ve anlamsal açıdan zengin vektör temsilleri üreten Sentence-Transformers (all-mpnet-base-v2) modeli kullanılmaktadır; bu da geri getirme kalitesini artırmaktadır. Ayrıca, bir çapraz kodlayıcı (cross-encoder) tabanlı yeniden sıralama mekanizması, ilk geri getirme sonuçlarını rafine ederek yalnızca bağlamsal olarak en alakalı belgelerin üretim modülüne iletilmesini sağlamaktadır. Performans değerlendirmesi, sistem yeteneklerini kapsamlı bir şekilde anlamak için bağlılık (faithfulness), alaka düzeyi (relevancy), doğruluk (correctness) ve bağlam doğruluğu (context precision) gibi metriklere odaklanan RAGAS değerlendirme ölçütleri kullanılarak gerçekleştirilmiştir. Yaptığımız ampirik analizler, Erişim Destekli Üretim performansı üzerinde indeks seçiminin derin etkisini ortaya koymakta ve geri getirme verimliliği ile doğruluk arasındaki dengeyi vurgulamaktadır. Hiyerarşik Gezilebilir Küçük Dünya (HNSW - Hierarchical Navigable Small World) indeksi ile yeniden sıralamanın entegrasyonu sayesinde, önerilen mimarimiz, yanıt bağlılığını artırırken hesaplama verimliliğini koruyan sağlam bir dengeye ulaşmaktadır. Sonuçlar, ileri düzey indeksleme stratejilerinin, akıllı parçalama ve yeniden sıralama ile birleştirildiğinde, büyük ölçekli dil modelleri ile alan bilgisine özgü geri getirme arasındaki boşluğu kapatma yeteneğini önemli ölçüde artırdığını göstermektedir. Bu bulgular, özellikle bağlam koruma, alan özgünlüğü ve hassasiyet gerektiren uygulamalarda Erişim Destekli Üretim sistemlerini optimize etme konusunda sağlam bir temel oluşturmaktadır. Çalışma, dinamik ve uyarlanabilir geri getirme mekanizmalarının, bir sonraki nesil konuşma tabanlı yapay zeka sistemleri için kritik bir etkinleştirici olduğunu vurgulamakta ve karmaşık ve yüksek riskli ortamlarda daha geniş bir benimseme için zemin hazırlamaktadır.

Özet (Çeviri)

Retrieval-Augmented Generation (RAG) architectures rely on the seamless integration of efficient retrieval and ranking mechanisms to enhance the accuracy, relevance, and contextual appropriateness of generated responses. In this study, we propose a comprehensive approach to improving the response performance of RAG systems by employing advanced techniques that address critical challenges in information retrieval and generation coherence. Our methodology introduces dynamic chunking to adaptively segment documents, ensuring improved contextual coherence and reducing information fragmentation. For embedding generation, we leverage Sentence-Transformers (all-mpnet-base-v2), which produce high-dimensional, semantically rich vector representations that enhance retrieval quality. Additionally, a cross-encoder-based re-ranking mechanism refines the initial retrieval results, ensuring that only the most contextually relevant documents are passed to the generation module. Performance evaluation is conducted using RAGAS metrics, focusing on faithfulness, relevancy, correctness, and context precision, providing a holistic understanding of system capabilities. Our empirical analyses reveal the profound impact of index choice on RAG performance, emphasizing the trade-offs between retrieval efficiency and accuracy. By integrating the HNSW (Hierarchical Navigable Small World) index with re-ranking, our proposed architecture achieves a robust balance, enhancing response fidelity while maintaining computational efficiency. The results demonstrate that advanced indexing strategies, when combined with intelligent chunking and re-ranking, significantly improve the system's ability to bridge the gap between large-scale language models and domain-specific knowledge retrieval. These insights establish a solid foundation for future research in optimizing RAG systems, especially in applications requiring high-context preservation, domain specificity, and precision. The study underscores the potential of dynamic and adaptive retrieval mechanisms as a critical enabler for next-generation conversational AI systems, paving the way for broader adoption in complex and high-stakes environments.

Benzer Tezler

  1. Advanced retrieval augmented generation: Multilingual semantic retrieval across document types by finetuning transformer based language models and OCR integration

    Gelişmiş erişim artirilmiş üretim: Belge türleri arasinda çok dilli anlamsal erişim için transformatör tabanli dil modellerini ince ayarlama ve OCR entegrasyonu

    ISMAIL OUBAH

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Aydın Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. SELCUK SENER

  2. Enhancing retrieval-augmented generation for data science: A comprehensive framework for academic literature navigation

    Veri bilimi odaklı bir RAG modeli: Akademik literatür tarama için kapsamlı bir araç

    AHMET YASİN AYTAR

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSabancı Üniversitesi

    Veri Bilimi Ana Bilim Dalı

    DOÇ. DR. KEMAL KILIÇ

    DOÇ. DR. KAMER KAYA

  3. Enhancing retrieval-augmented generation: Optimizing document splits and parameters for improved language model responses

    Alımla zenginleştirişmiş üretı̇mı̇n gelı̇ştı̇rı̇lmesı̇: Gelı̇şmı̇ş dı̇l modelı̇ yanıtları ı̇çı̇n belge ayrımlarının ve parametrelerı̇n optı̇mı̇ze edı̇lmesı̇

    CABİR ÇELİK

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAtılım Üniversitesi

    Yazılım Mühendisliği Ana Bilim Dalı

    DOÇ. DR. BEYTULLAH YILDIZ

  4. Küçük dil modellerinin türkçe bağlamlı soru-cevap ve çıkarım görevlerinde ingilizce akıl yürütme-türkçe yanıt stratejisiyle lora ince ayarı

    Lora fine-tuning of small language models for turkish contextual question answering and inference via an english reasoning–turkish answer strategy

    MEHMET ÇAĞRI ÇALIŞKAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2025

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolÜsküdar Üniversitesi

    Yapay Zeka Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ GÖKALP TULUM

  5. Enhancing warehouse efficiency through geographic information system and genetic algorithm

    Coğrafi bilgi sistemleri ve genetik algoritma ile depo verimliliğinin artırılması

    ONUR YÜREKLİ

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Mühendislik Bilimleriİstanbul Teknik Üniversitesi

    Geomatik Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ MUHAMMED ENES ATİK