Geri Dön

Sağlık verileri üzerinde büyük dil modeli ile yeni bir yaklaşım

A new large language model based approach on health data

  1. Tez No: 964641
  2. Yazar: BEHÇET ŞENTÜRK
  3. Danışmanlar: PROF. DR. MEHMET SERDAR GÜZEL
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2025
  8. Dil: Türkçe
  9. Üniversite: Ankara Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 64

Özet

Bu tez çalışması, sağlık alanındaki yapılandırılmamış metin verilerinden (akademik tezler gibi) etkin bilgi çıkarımı ve sorgulaması için Büyük Dil Modelleri (BDM) ve Almayla Artırılmış Üretim (RAG) teknolojilerine dayalı yenilikçi bir yaklaşım sunmaktadır. Amaç, sağlık profesyonellerinin bilgiye erişimini hızlandırmaktır. Bu kapsamda, Otizm Spektrum Bozukluğu (OSB) üzerine yazılmış Türkçe tezler üzerinde, anlamsal benzerliğe dayalı Vektör Tabanlı RAG ile yapısal bilgi çıkarımına odaklanan Bilgi Grafiği (KG) Tabanlı RAG prototipleri geliştirilip karşılaştırılmıştır. Sistemlerin performansı, farklı zorluk seviyelerinde 100 soruluk bir benchmark veri seti ve BDM tabanlı otomatik skorlama ile ölçülmüştür. Bulgular, Vektör Tabanlı RAG'ın genel sorgularda (%71,45 başarı) daha yüksek performans gösterdiğini ortaya koymuştur. Buna karşın KG Tabanlı RAG (%66,55 başarı), özellikle karmaşık ve ilişkisel bilgi gerektiren zor sorularda daha güçlü bir potansiyel sergilemiştir. İki yaklaşımın birleştirildiği ideal bir hibrit senaryonun ise başarıyı %79,1'e yükseltebileceği görülmüştür. Bu çalışma, gelişmiş RAG sistemlerinin Türkçe sağlık metinlerine uygulanabilirliğini ve görece düşük maliyetli BDM'ler ile etkili çözümlerin potansiyelini göstermektedir. Elde edilen bulguların, gelecekteki klinik karar destek sistemlerine ve Türkçe doğal dil işleme araştırmalarına katkı sağlaması hedeflenmektedir.

Özet (Çeviri)

This thesis presents an innovative approach using Large Language Models (LLMs) and Retrieval-Augmented Generation (RAG) for effective information extraction from unstructured healthcare texts, such as academic theses, to accelerate information access for professionals. Within this scope, two RAG prototypes were developed and compared on a corpus of Turkish theses on Autism Spectrum Disorder (ASD): a Vector-Based RAG using semantic similarity and a Knowledge Graph (KG)-Based RAG focused on structured data extraction. The systems' performance was evaluated using a 100-question benchmark of varying complexity and LLM-based automated scoring. Findings revealed that Vector-Based RAG performed better on general queries (71.45% overall success). In contrast, KG-Based RAG (66.55% success) demonstrated stronger potential for complex, relational questions. An ideal hybrid scenario combining both approaches indicated a potential success rate of 79.1%. This study demonstrates the applicability of advanced RAG systems for Turkish health texts, showcasing the potential of developing effective solutions with relatively low-cost LLMs. The findings are expected to contribute to future clinical decision support systems and Turkish natural language processing research.

Benzer Tezler

  1. Designing an expert system for non-expert users in oral health: Story of a hybrid design research

    Ağız sağlığı alanında uzman olmayan kullanıcılar için uzman sistem tasarlamak: Hibrit tasarım araştırması hikayesi

    DENİZ GÖÇHAN

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Diş Hekimliğiİstanbul Teknik Üniversitesi

    Endüstriyel Tasarım Ana Bilim Dalı

    PROF. DR. HATİCE HÜMANUR BAĞLI

  2. Machine-learning approaches for neurological disorder diagnosis from genomic and neuroimaging data

    Genomik ve nörogörüntüleme verilerinden nörolojik bozukluk teşhisi için makine öğrenmesi yaklaşımları

    İSMAİL BİLGEN

    Doktora

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. BEHÇET UĞUR TÖREYİN

  3. An optimization model to control the flow of relief commodities in humanitarian supply chain under uncertainty

    Belirsiz koşullarda insani yardım tedarik zinciri malzeme akışını kontrol etmede optimizasyon modeli

    ISRAA ISMAIL

    Doktora

    İngilizce

    İngilizce

    2021

    Endüstri ve Endüstri Mühendisliğiİstanbul Teknik Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ESRA BAŞ

  4. Urban ecotherapy: A comparative evaluation on the therapy potentials of park features in Istanbul

    Kentsel ekoterapi: İstanbul'daki park özelliklerinin terapi potansiyelleri üzerine karşılaştırmalı bir değerlendirme

    DİDEM KARA

    Yüksek Lisans

    İngilizce

    İngilizce

    2021

    Şehircilik ve Bölge Planlamaİstanbul Teknik Üniversitesi

    Kentsel Tasarım Ana Bilim Dalı

    DOÇ. DR. GÜLDEN DEMET ORUÇ

  5. Global goals, local voices: A multinational comparative sentiment and topic analysis of public transportation in the context of SDGs

    Küresel hedefler, yerel sesler: Sürdürülebilir kalkınma amaçları bağlamında toplu taşımaya yönelik ülkelerin karşılaştırmalı duygu ve konu analizi

    ASLIGÜL AKSAN

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Endüstri ve Endüstri Mühendisliğiİstanbul Teknik Üniversitesi

    İşletme Mühendisliği Ana Bilim Dalı

    PROF. DR. HATİCE CAMGÖZ AKDAĞ