Accuracy of advanced large language models for assessing depression and anxiety: A comparative study with evidence-based scales
Gelişmiş büyük dil modellerinin depresyon ve anksiyete değerlendirme doğruluğu: Kanıta dayalı ölçeklerle karşılaştırmalı bir çalışma
- Tez No: 966174
- Danışmanlar: DR. ÖĞR. ÜYESİ MEHMET KAAN İLDİZ
- Tez Türü: Yüksek Lisans
- Konular: Psikiyatri, Psikoloji, Psychiatry, Psychology
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2025
- Dil: İngilizce
- Üniversite: Üsküdar Üniversitesi
- Enstitü: Sağlık Bilimleri Enstitüsü
- Ana Bilim Dalı: Nörobilim Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 79
Özet
Depresyon ve anksiyete bozuklukları, doğru ve erişilebilir değerlendirme araçlarını gerektiren önemli bir küresel sağlık yükünü temsil etmektedir. Beck Depresyon Envanteri (BDE) ve Beck Anksiyete Envanteri (BAE) gibi kanıta dayalı ölçekler klinik temel taşlar olsa da, bu ölçeklerin geliştirilmesi kaynak-yoğun bir süreçtir ve geliştiricilerinin öznel deneyimleriyle sınırlanabilmektedir. Bu çalışmanın amacı, GPT-o3-mini ve DeepSeek-R1 adlı iki gelişmiş Büyük Dil Modeli (BDM) tarafından oluşturulan depresyon ve anksiyete ölçen karma birer ölçek geliştirmek ve performanslarını BDE ve BAE'nin geçerli Türkçe versiyonları ile karşılaştırmaktır. Çalışmaya 222 Türkçe konuşan yetişkin katılmış ve dört ölçeği de içeren çevrimiçi bir anketi tamamlamıştır. Güvenilirlik Cronbach alfa katsayısı ile, geçerlilik ise Pearson korelasyon analizi ile değerlendirilmiştir. Sonuçlar, BDM tarafından geliştirilenler de dahil olmak üzere tüm ölçeklerin yüksek iç tutarlılığa sahip olduğunu göstermiştir (α ≥ .86). DeepSeek-R1 ölçeği, ilgili standart ölçeklerle (BDE: r=.538, p
Özet (Çeviri)
Depression and anxiety disorders represent a significant global health burden, necessitating accurate and accessible assessment tools. While evidence-based scales like the Beck Depression Inventory (BDI) and Beck Anxiety Inventory (BAI) are clinical cornerstones, their development is resource-intensive and may be constrained by the subjective experiences of their creators. This study aimed to develop a composite scale measuring depression and anxiety generated by two advanced Large Language Models (LLMs)—GPT-o3-mini and DeepSeek-R1—and to compare their performance against the validated Turkish versions of the BDI and BAI. A sample of 222 Turkish-speaking adults completed an online survey containing all four instruments. Reliability was assessed using Cronbach's alpha, and validity was examined via Pearson correlations. The results indicated that all scales, including the LLM-generated ones, possess high internal consistency (α ≥ .86). The DeepSeek-R1 scale demonstrated moderate convergent validity with their respective standard measures (BDI: r=.538, p
Benzer Tezler
- Automated code review: Empirical evidence from experiments and industry
Otomatik kod gözden geçirme: Deneylerden ve endüstriden elde edilen bulgular
UMUT CİHAN
Yüksek Lisans
İngilizce
2025
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİhsan Doğramacı Bilkent ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ERAY TÜZÜN
- İklimlendirme sistemleri üzerinde makine öğrenmesi ile anomali tespiti
Anomaly detection with machine learning on air conditioning systems
REFİK KİBAR
Yüksek Lisans
Türkçe
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSakarya ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ MUHAMMED FATİH ADAK
DR. ÖĞR. ÜYESİ KEVSER OVAZ AKPINAR
- İnsansız hava aracı için bir borda bilgisayarının mimarisi ve tasarımı
Başlık çevirisi yok
SAİT N. YURT
Yüksek Lisans
Türkçe
1995
Astronomi ve Uzay Bilimleriİstanbul Teknik ÜniversitesiY.DOÇ.DR. T. BERAT KARYOT
- Deki: A multimodal image-to-code transformation and vision-based gui agents
Dekı: Çok modlu görüntüden koda dönüşüm ve görme tabanlı guı ajanları
RASUL OSMANBAYLİ
Yüksek Lisans
İngilizce
2025
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Aydın ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ SELÇUK ŞENER
- Yapay zeka tabanlı büyük dil modellerinin 0-24 ay bebek sağlığı konusunda sık sorulan sorulara yanıtlarının değerlendirilmesi
Evaluation of artificial intelligence-based large language models' responses to frequently asked questions about infant health in the 0-24 month age range
MELİH KIRAN
Tıpta Uzmanlık
Türkçe
2025
Aile HekimliğiSağlık Bilimleri ÜniversitesiAile Hekimliği Ana Bilim Dalı
DR. İREP KARATAŞ ERAY