Geri Dön

ChatGPT ve tıp fakültesi 6. sınıf öğrencilerinin ayırıcı tanı yeterliliğinin karşılaştırılması

Comparison of differential diagnosis competency between ChatGPT and sixth-year medical students

  1. Tez No: 945200
  2. Yazar: ZEYNEL CANER KAYMAK
  3. Danışmanlar: DOÇ. DR. MEHMET ALİ KARACA
  4. Tez Türü: Tıpta Uzmanlık
  5. Konular: Acil Tıp, Eğitim ve Öğretim, Emergency Medicine, Education and Training
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2025
  8. Dil: Türkçe
  9. Üniversite: Hacettepe Üniversitesi
  10. Enstitü: Tıp Fakültesi
  11. Ana Bilim Dalı: Acil Tıp Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 59

Özet

Bu çalışmada, intörn doktorların ayırıcı tanı koyma yetkinlikleri, ChatGPT ile karşılaştırılmıştır. Çalışma, Hacettepe Üniversitesi Tıp Fakültesi'nde 120 öğrencinin katılımıyla gerçekleştirilmiştir. ChatGPT'nin dört farklı sürümü (4o, 4o mini, 4o.1 ve 4o.1 mini) kullanılmıştır. Çalışmada 30 klinik vaka kullanılmıştır ve vakalar UÇEP-2020 müfredatına göre hazırlanmıştır. İntörnler ve ChatGPT'den vakalar için beş ön tanı ve bir en olası tanı istenmiştir. Sorular, ChatGPT'ye dil olarak uzun ve kısa metinlerle yöneltilmiştir. Yanıtlar; dolaşım, gastrointestinal, sinir-davranış, ürogenital, solunum ve multisistem kategorilerinde değerlendirilmiştir. Çalışmada, ChatGPT'nin doğru cevap oranlarının genel olarak intörn doktorlardan daha yüksek olduğu görülmüştür. İntörnlerin doğru cevap ortancası %66.7 iken, ChatGPT'nin (kısa ve uzun metinlerde) %83.3 olarak bulunmuştur. Alt kategoriler incelendiğinde, dolaşım ve gastrointestinal sistem sorularında ChatGPT'nin doğru cevaplarının ortancası %87.5'in üzerinde iken, sinir-davranış ve solunum sistem sorularında intörnler ile ChatGPT arasında daha düşük bir fark gözlemlenmiştir. Ön tanı doğruluk oranlarında ChatGPT ve intörnler arasında benzer sonuçlar elde edilmiştir. İstatistiksel analizlerde, toplam doğru cevap oranlarında anlamlı bir fark bulunurken (p=0.004), ön tanıların doğruluk oranlarında anlamlı bir fark saptanmamıştır. ChatGPT sürümleri arasında ise uzun ve kısa metinler açısından anlamlı bir performans farkı tespit edilmemiştir. Sonuç olarak ChatGPT'nin kesin tanı belirlemede intörnlerden daha yüksek doğruluk oranına sahip olduğu tespit edilmiştir. Ancak, ChatGPT'nin detaylı ve sadeleştirilmiş soru metinlerine verdiği yanıtlar arasında performans farkı bulunmamıştır. Yapay zekanın acil tıp hizmetlerinde yardımcı bir araç olarak kullanılabilmesi için daha fazla araştırmaya ihtiyaç vardır.

Özet (Çeviri)

This study compares the differential diagnosis competencies of intern doctors with ChatGPT. The study was conducted with the participation of 120 students from Hacettepe University Faculty of Medicine, utilizing four different versions of ChatGPT (4o, 4o mini, 4o.1, and 4o.1 mini). The study included 30 clinical cases, prepared according to the UÇEP-2020 curriculum. Interns and ChatGPT were asked to provide five differential diagnoses and one most probable diagnosis for each case. The questions were presented to ChatGPT in both detailed and simplified text formats. The responses were evaluated across six categories: circulatory, gastrointestinal, neurological-behavioral, urogenital, respiratory, and multisystem. ChatGPT demonstrated higher overall accuracy rates compared to intern doctors. While the median correct response rate for interns was 66.7%, ChatGPT achieved a median accuracy of 83.3% for both detailed and simplified question formats. In subcategory analyses, ChatGPT's median accuracy exceeded 87.5% in circulatory and gastrointestinal cases, whereas the differences in accuracy between interns and ChatGPT were less pronounced in neurological-behavioral and respiratory cases. The differential diagnosis accuracy rates were similar between ChatGPT and interns. Statistical analyses revealed a significant difference in overall correct response rates (p=0.004), while no significant difference was found in differential diagnosis accuracy rates. Additionally, no meaningful performance difference was detected between ChatGPT versions or between detailed and simplified question formats. Inconclusion, ChatGPT demonstrated higher accuracy rates than interns in definitive diagnoses. However, no performance difference was observed between responses to detailed and simplified question formats. Further research is needed to explore the potential role of artificial intelligence as an assistive tool in emergency medical services.

Benzer Tezler

  1. Sıçan alt ekstremite akut iskemi reperfüzyon modelinde oluşturulan oksidatif stres hasarına karşı intravenöz glutatyonun olası koruyucu etkileri

    Possible protective effects of intravenous glutathione against the oxidative stress induced in hind limb ischemia-reperfusion injury model in rats

    MERT MERİÇ

    Tıpta Uzmanlık

    Türkçe

    Türkçe

    2024

    Biyokimyaİstanbul Üniversitesi

    Kalp ve Damar Cerrahisi Ana Bilim Dalı

    PROF. DR. İBRAHİM UFUK ALPAGUT

  2. Acil servise göğüs ağrısı şikayeti ile başvuran hastaların esı triajı ve EDACS değerlendirmelerinin yapay zeka ile karşılaştırılması

    Comparison of esi triage and EDACS assessments with artificial intelligence in patients presenting to the emergency department with chest pain

    MEHMET OKAN ÇINAR

    Tıpta Uzmanlık

    Türkçe

    Türkçe

    2025

    Acil TıpNecmettin Erbakan Üniversitesi

    Acil Tıp Ana Bilim Dalı

    PROF. DR. SEDAT KOÇAK

  3. Yapay zeka programlarının (ChatGPT ve Gemini) Aciliyet Şiddeti İndeksi (AŞİ) ve renk kodlu kombine triyaj uygulamasındaki etkinlikleri

    Effectiveness of artificial intelligence programs (ChatGPT and Gemini) in the Emergency Severity Index (ESI) and color-coded combined triage application

    OĞUZHAN YILMAZ

    Tıpta Uzmanlık

    Türkçe

    Türkçe

    2025

    Acil TıpSağlık Bilimleri Üniversitesi

    Acil Tıp Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ÖZGEN GÖNENÇ ÇEKİÇ

  4. Hafif kafa travmalı hastalarda kranial BT taramalarına karar vermede yapay zekâ uygulamaları ile hekimlerin karşılaştırılması

    Comparing physicians with artificial intelligence applications in decision-making for cranial CT scans in patients with mild head trauma

    SÜLEYMAN CEM AKIL

    Tıpta Uzmanlık

    Türkçe

    Türkçe

    2024

    Acil TıpKaradeniz Teknik Üniversitesi

    Acil Tıp Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ MELİH İMAMOĞLU

  5. Kliniğimizde histerektomi planlanan hastaların endikasyonlarının yapay zekâ programının önerileri ile karşılaştırılması

    Comparison of indications for hysterectomy in our clinic with recommendations of the artificial intelligence program

    SALTUK BUĞRA ARIKAN

    Tıpta Uzmanlık

    Türkçe

    Türkçe

    2023

    Bilim ve TeknolojiAkdeniz Üniversitesi

    Kadın Hastalıkları ve Doğum Ana Bilim Dalı

    DOÇ. DR. MAHMUT İLKİN YERAL