Geri Dön

Çocuk hastaların tanısının belirlenmesinde hasta verilerindeki özniteliklerin çıkarılması

Feature extraction from patient data for diagnosing pediatric patients

  1. Tez No: 888548
  2. Yazar: GAMZE ALTUNSAÇAN
  3. Danışmanlar: DOÇ. DR. BİROL ASLANYÜREK, DOÇ. DR. EMRAH AYDIN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Çocuk Cerrahisi, İstatistik, Computer Engineering and Computer Science and Control, Pediatric Surgery, Statistics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2024
  8. Dil: Türkçe
  9. Üniversite: Yıldız Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Matematik Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Matematik Mühendisliği Bilim Dalı
  13. Sayfa Sayısı: 57

Özet

Günümüzde hastalıkların teşhis edilmesi, yeni tedaviler bulunması veya sağlık çalışanlarına destek olunması amacıyla çok fazla sayıda yapay zekâ temelli yöntem geliştirilmiştir. Büyük miktardaki sağlık verilerinin işlenmesi sonucu sağlık alanındaki ciddi ilerlemelere rağmen gelinen seviyenin sadece başlangıç olduğu söylenebilir. Bir hasta, bir sağlık kurumuna başvurduğunda hastanın şikâyeti, hikayesi, test sonuçları, aldığı tanı, kullanılan ilaçlar, geçirdiği operasyonlar gibi birçok bilgi elektronik kayıt sistemlerinde tutulur. Bu bilgilerin bir kısmı yapılandırılmış haldedir ve kolayca makine öğrenmesi yöntemlerinde öznitelik olarak kullanılabilir. Semptomları da içeren klinik metinler ise yapılandırılmamış halde tutulmakta ve bu nedenle doğrudan makine öğrenmesi yaklaşımında kullanmaya uygun değillerdir. Hastalıkların tanısının konmasında semptomların çok büyük etkisi vardır. Bu nedenle metin içinden semptom çıkarımı yapılarak metin verilerinin yapılandırılmış hale dönüştürülmesi, makine öğrenmesi yaklaşımlarıyla hastalıkların tespit edilmesi ve tanı süreçlerinin iyileştirilmesi açısından önemli bir rol oynayacaktır. Bu kapsamda, bu tezin amacı çocuk hastalara ait Türkçe klinik metinlerden semptom çıkarımıdır. Yapılandırılmamış klinik metin verilerinden semptom çıkarımı için çeşitli doğal dil işleme teknikleri kullanılmıştır. Metin verileri toplandıktan sonra öncelikle anonimleştirilmiştir. Anonimleştirme işleminin ardından çocuk hastalıkları uzmanlarının desteğiyle veri seti üzerinden semptomlar etiketlenmiştir ve ardından temizleme, dönüştürme ve normalizasyon gibi ön-işlemler yapılmıştır. Temizlenmiş verileri makine öğrenmesi yöntemlerinde öznitelik olarak kullanmak amacıyla çeşitli vektörleştirme teknikleri aracılığıyla metinler sayısal hale dönüştürülmüştür. Son olarak karar ağaçları, destek vektör makineleri, lojistik regresyon, yapay sinir ağları ve rastgele orman yöntemi gibi toplu ağaç sınıflandırıcılarıyla semptomların varlığı-yokluğu ve varsa semptomun ne olduğu tahmin edilmiştir. Özellikle karar ağacı ve toplu ağaç sınıflandırıcılarının oldukça başarılı makine öğrenmesi modelleri geliştirdiği gözlemlenmiştir.

Özet (Çeviri)

Nowadays, many artificial intelligence-based methods have been developed for diagnosing diseases, discovering new treatments, or providing support. Despite significant advances in the healthcare field resulting from processing large amounts of health data, it can be said that the current level is only the beginning. When a patient applies to a health institution, various information such as the patient's complaints, medical history, test results, diagnosis, medications, and surgeries are recorded in electronic systems. Some of this information is structured and can easily be used as features in machine learning methods. However, clinical texts that include symptoms are kept in unstructured formats and are therefore not suitable for direct use in machine learning approaches. Symptoms play a very important role in diagnosing diseases. Extracting symptoms from text converts text data into a structured format and thus plays a significant role in identifying diseases and improving diagnosis processes through machine learning approaches. In this context, the aim of this thesis is to extract symptoms from Turkish clinical texts of pediatric patients. In this study, various natural language processing techniques were used for symptom extraction from unstructured clinical text data. After collecting the text data, they were first anonymized. After the anonymization process, symptoms were labeled in the data set with the support of pediatric specialists, and then pre-processing steps such as cleaning, transformation and normalization were carried out. The cleaned data was converted into numerical form using various vectorization techniques to be used as features in machine learning methods. Finally, decision trees, support vector machines, logistic regression, artificial neural networks, and ensemble tree classifiers such as random forests were employed to predict the presence or absence of symptoms and, if present, to identify the specific symptoms. It was observed that especially decision tree and ensemble tree classifiers developed successful machine learning models.

Benzer Tezler

  1. Çocuklardaki genetik geçişli renal hastalıklarda hedef spesifik dizayn edilmiş yeni nesil sekanslama yönteminin klinik tanıdaki öneminin belirlenmesi

    Determining the importance of a target-specific design new generation sequencing method in the clinical diagnosis of inherited renal diseases in children

    MURAT ÇETİN

    Tıpta Uzmanlık

    Türkçe

    Türkçe

    2023

    Çocuk Sağlığı ve HastalıklarıGazi Üniversitesi

    Çocuk Sağlığı ve Hastalıkları Ana Bilim Dalı

    PROF. DR. HATİCE KİBRİYA FİDAN

  2. Demir eksikliği tanısında serum transferrin reseptörünün ve onun ferritin logaritmasına oranının önemi

    The Importance of serum transferrin receptor and its ratio serum ferritin in the diagnosis of iron deficiency

    VİLDAN KOŞAN ÇULHA

    Tıpta Uzmanlık

    Türkçe

    Türkçe

    2000

    HematolojiAnkara Üniversitesi

    Çocuk Sağlığı ve Hastalıkları Ana Bilim Dalı

    PROF. DR. ZÜMRÜT UYSAL

  3. Sol-sağ şantlı doğuştan kalp hastalığı olan süt çocuklarında dekonjestif tedavi öncesi ve sonrasında N Tip ProBNP düzeylerinin değerlendirilmesi

    Evaluation of NT-ProBNP levels in infants with left to right shunt congenital heart disease before and after decongestive therapy

    PINAR ÇOLAK

    Tıpta Uzmanlık

    Türkçe

    Türkçe

    2013

    Çocuk Sağlığı ve HastalıklarıÇukurova Üniversitesi

    Dahili Tıp Bilimleri Bölümü

    PROF. DR. NAZAN ÖZBARLAS

  4. Yenidoğan sepsisinin tanısında serum PRO-BNP (ProB tip natriüretik peptid)'in değeri

    Diagnostic value of serum PRO-BNP (ProB type natriüretic peptid) levels in neonatal sepsis

    İBRAHİM DEĞER

    Tıpta Uzmanlık

    Türkçe

    Türkçe

    2009

    Çocuk Sağlığı ve HastalıklarıYüzüncü Yıl Üniversitesi

    Çocuk Sağlığı ve Hastalıkları Ana Bilim Dalı

    PROF. DR. ABDULLAH CEYLAN

  5. Biyotinidaz eksikliği tanılı hastaların klinik, laboratuvar bulguları ile uzun dönem izlem sonuçlarının değerlendirilmesi

    Evaluation of clinical and laboratory findings and LONG-TERM follow-up results of patients diagnosed with biotinidase deficiency

    AGSHIN RZAYEV

    Tıpta Uzmanlık

    Türkçe

    Türkçe

    2021

    Çocuk Sağlığı ve Hastalıklarıİstanbul Üniversitesi-Cerrahpaşa

    Çocuk Sağlığı ve Hastalıkları Ana Bilim Dalı

    DOÇ. DR. AYŞE ÇİĞDEM AKTUĞLU ZEYBEK