Sağlık verileri üzerinde büyük dil modeli ile yeni bir yaklaşım
A new large language model based approach on health data
- Tez No: 964641
- Danışmanlar: PROF. DR. MEHMET SERDAR GÜZEL
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2025
- Dil: Türkçe
- Üniversite: Ankara Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 64
Özet
Bu tez çalışması, sağlık alanındaki yapılandırılmamış metin verilerinden (akademik tezler gibi) etkin bilgi çıkarımı ve sorgulaması için Büyük Dil Modelleri (BDM) ve Almayla Artırılmış Üretim (RAG) teknolojilerine dayalı yenilikçi bir yaklaşım sunmaktadır. Amaç, sağlık profesyonellerinin bilgiye erişimini hızlandırmaktır. Bu kapsamda, Otizm Spektrum Bozukluğu (OSB) üzerine yazılmış Türkçe tezler üzerinde, anlamsal benzerliğe dayalı Vektör Tabanlı RAG ile yapısal bilgi çıkarımına odaklanan Bilgi Grafiği (KG) Tabanlı RAG prototipleri geliştirilip karşılaştırılmıştır. Sistemlerin performansı, farklı zorluk seviyelerinde 100 soruluk bir benchmark veri seti ve BDM tabanlı otomatik skorlama ile ölçülmüştür. Bulgular, Vektör Tabanlı RAG'ın genel sorgularda (%71,45 başarı) daha yüksek performans gösterdiğini ortaya koymuştur. Buna karşın KG Tabanlı RAG (%66,55 başarı), özellikle karmaşık ve ilişkisel bilgi gerektiren zor sorularda daha güçlü bir potansiyel sergilemiştir. İki yaklaşımın birleştirildiği ideal bir hibrit senaryonun ise başarıyı %79,1'e yükseltebileceği görülmüştür. Bu çalışma, gelişmiş RAG sistemlerinin Türkçe sağlık metinlerine uygulanabilirliğini ve görece düşük maliyetli BDM'ler ile etkili çözümlerin potansiyelini göstermektedir. Elde edilen bulguların, gelecekteki klinik karar destek sistemlerine ve Türkçe doğal dil işleme araştırmalarına katkı sağlaması hedeflenmektedir.
Özet (Çeviri)
This thesis presents an innovative approach using Large Language Models (LLMs) and Retrieval-Augmented Generation (RAG) for effective information extraction from unstructured healthcare texts, such as academic theses, to accelerate information access for professionals. Within this scope, two RAG prototypes were developed and compared on a corpus of Turkish theses on Autism Spectrum Disorder (ASD): a Vector-Based RAG using semantic similarity and a Knowledge Graph (KG)-Based RAG focused on structured data extraction. The systems' performance was evaluated using a 100-question benchmark of varying complexity and LLM-based automated scoring. Findings revealed that Vector-Based RAG performed better on general queries (71.45% overall success). In contrast, KG-Based RAG (66.55% success) demonstrated stronger potential for complex, relational questions. An ideal hybrid scenario combining both approaches indicated a potential success rate of 79.1%. This study demonstrates the applicability of advanced RAG systems for Turkish health texts, showcasing the potential of developing effective solutions with relatively low-cost LLMs. The findings are expected to contribute to future clinical decision support systems and Turkish natural language processing research.
Benzer Tezler
- Designing an expert system for non-expert users in oral health: Story of a hybrid design research
Ağız sağlığı alanında uzman olmayan kullanıcılar için uzman sistem tasarlamak: Hibrit tasarım araştırması hikayesi
DENİZ GÖÇHAN
Yüksek Lisans
İngilizce
2023
Diş Hekimliğiİstanbul Teknik ÜniversitesiEndüstriyel Tasarım Ana Bilim Dalı
PROF. DR. HATİCE HÜMANUR BAĞLI
- Machine-learning approaches for neurological disorder diagnosis from genomic and neuroimaging data
Genomik ve nörogörüntüleme verilerinden nörolojik bozukluk teşhisi için makine öğrenmesi yaklaşımları
İSMAİL BİLGEN
Doktora
İngilizce
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. BEHÇET UĞUR TÖREYİN
- An optimization model to control the flow of relief commodities in humanitarian supply chain under uncertainty
Belirsiz koşullarda insani yardım tedarik zinciri malzeme akışını kontrol etmede optimizasyon modeli
ISRAA ISMAIL
Doktora
İngilizce
2021
Endüstri ve Endüstri Mühendisliğiİstanbul Teknik ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
DOÇ. DR. ESRA BAŞ
- Urban ecotherapy: A comparative evaluation on the therapy potentials of park features in Istanbul
Kentsel ekoterapi: İstanbul'daki park özelliklerinin terapi potansiyelleri üzerine karşılaştırmalı bir değerlendirme
DİDEM KARA
Yüksek Lisans
İngilizce
2021
Şehircilik ve Bölge Planlamaİstanbul Teknik ÜniversitesiKentsel Tasarım Ana Bilim Dalı
DOÇ. DR. GÜLDEN DEMET ORUÇ
- Global goals, local voices: A multinational comparative sentiment and topic analysis of public transportation in the context of SDGs
Küresel hedefler, yerel sesler: Sürdürülebilir kalkınma amaçları bağlamında toplu taşımaya yönelik ülkelerin karşılaştırmalı duygu ve konu analizi
ASLIGÜL AKSAN
Yüksek Lisans
İngilizce
2024
Endüstri ve Endüstri Mühendisliğiİstanbul Teknik Üniversitesiİşletme Mühendisliği Ana Bilim Dalı
PROF. DR. HATİCE CAMGÖZ AKDAĞ