Geri Dön

Accuracy of advanced large language models for assessing depression and anxiety: A comparative study with evidence-based scales

Gelişmiş büyük dil modellerinin depresyon ve anksiyete değerlendirme doğruluğu: Kanıta dayalı ölçeklerle karşılaştırmalı bir çalışma

  1. Tez No: 966174
  2. Yazar: FURKAN KIZILIŞIK
  3. Danışmanlar: DR. ÖĞR. ÜYESİ MEHMET KAAN İLDİZ
  4. Tez Türü: Yüksek Lisans
  5. Konular: Psikiyatri, Psikoloji, Psychiatry, Psychology
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2025
  8. Dil: İngilizce
  9. Üniversite: Üsküdar Üniversitesi
  10. Enstitü: Sağlık Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Nörobilim Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 79

Özet

Depresyon ve anksiyete bozuklukları, doğru ve erişilebilir değerlendirme araçlarını gerektiren önemli bir küresel sağlık yükünü temsil etmektedir. Beck Depresyon Envanteri (BDE) ve Beck Anksiyete Envanteri (BAE) gibi kanıta dayalı ölçekler klinik temel taşlar olsa da, bu ölçeklerin geliştirilmesi kaynak-yoğun bir süreçtir ve geliştiricilerinin öznel deneyimleriyle sınırlanabilmektedir. Bu çalışmanın amacı, GPT-o3-mini ve DeepSeek-R1 adlı iki gelişmiş Büyük Dil Modeli (BDM) tarafından oluşturulan depresyon ve anksiyete ölçen karma birer ölçek geliştirmek ve performanslarını BDE ve BAE'nin geçerli Türkçe versiyonları ile karşılaştırmaktır. Çalışmaya 222 Türkçe konuşan yetişkin katılmış ve dört ölçeği de içeren çevrimiçi bir anketi tamamlamıştır. Güvenilirlik Cronbach alfa katsayısı ile, geçerlilik ise Pearson korelasyon analizi ile değerlendirilmiştir. Sonuçlar, BDM tarafından geliştirilenler de dahil olmak üzere tüm ölçeklerin yüksek iç tutarlılığa sahip olduğunu göstermiştir (α ≥ .86). DeepSeek-R1 ölçeği, ilgili standart ölçeklerle (BDE: r=.538, p

Özet (Çeviri)

Depression and anxiety disorders represent a significant global health burden, necessitating accurate and accessible assessment tools. While evidence-based scales like the Beck Depression Inventory (BDI) and Beck Anxiety Inventory (BAI) are clinical cornerstones, their development is resource-intensive and may be constrained by the subjective experiences of their creators. This study aimed to develop a composite scale measuring depression and anxiety generated by two advanced Large Language Models (LLMs)—GPT-o3-mini and DeepSeek-R1—and to compare their performance against the validated Turkish versions of the BDI and BAI. A sample of 222 Turkish-speaking adults completed an online survey containing all four instruments. Reliability was assessed using Cronbach's alpha, and validity was examined via Pearson correlations. The results indicated that all scales, including the LLM-generated ones, possess high internal consistency (α ≥ .86). The DeepSeek-R1 scale demonstrated moderate convergent validity with their respective standard measures (BDI: r=.538, p

Benzer Tezler

  1. Automated code review: Empirical evidence from experiments and industry

    Otomatik kod gözden geçirme: Deneylerden ve endüstriden elde edilen bulgular

    UMUT CİHAN

    Yüksek Lisans

    İngilizce

    İngilizce

    2025

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİhsan Doğramacı Bilkent Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ERAY TÜZÜN

  2. İklimlendirme sistemleri üzerinde makine öğrenmesi ile anomali tespiti

    Anomaly detection with machine learning on air conditioning systems

    REFİK KİBAR

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSakarya Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ MUHAMMED FATİH ADAK

    DR. ÖĞR. ÜYESİ KEVSER OVAZ AKPINAR

  3. Deki: A multimodal image-to-code transformation and vision-based gui agents

    Dekı: Çok modlu görüntüden koda dönüşüm ve görme tabanlı guı ajanları

    RASUL OSMANBAYLİ

    Yüksek Lisans

    İngilizce

    İngilizce

    2025

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Aydın Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ SELÇUK ŞENER

  4. Yapay zeka tabanlı büyük dil modellerinin 0-24 ay bebek sağlığı konusunda sık sorulan sorulara yanıtlarının değerlendirilmesi

    Evaluation of artificial intelligence-based large language models' responses to frequently asked questions about infant health in the 0-24 month age range

    MELİH KIRAN

    Tıpta Uzmanlık

    Türkçe

    Türkçe

    2025

    Aile HekimliğiSağlık Bilimleri Üniversitesi

    Aile Hekimliği Ana Bilim Dalı

    DR. İREP KARATAŞ ERAY