Çocuk hastaların tanısının belirlenmesinde hasta verilerindeki özniteliklerin çıkarılması

Feature extraction from patient data for diagnosing pediatric patients

PDF İndir

Tez No: 888548
Yazar: GAMZE ALTUNSAÇAN
Danışmanlar: DOÇ. DR. BİROL ASLANYÜREK, DOÇ. DR. EMRAH AYDIN
Tez Türü: Yüksek Lisans
Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Çocuk Cerrahisi, İstatistik, Computer Engineering and Computer Science and Control, Pediatric Surgery, Statistics
Anahtar Kelimeler: Belirtilmemiş.
Yıl: 2024
Dil: Türkçe
Üniversite: Yıldız Teknik Üniversitesi
Enstitü: Fen Bilimleri Enstitüsü
Ana Bilim Dalı: Matematik Mühendisliği Ana Bilim Dalı
Bilim Dalı: Matematik Mühendisliği Bilim Dalı
Sayfa Sayısı: 57

Özet

Günümüzde hastalıkların teşhis edilmesi, yeni tedaviler bulunması veya sağlık çalışanlarına destek olunması amacıyla çok fazla sayıda yapay zekâ temelli yöntem geliştirilmiştir. Büyük miktardaki sağlık verilerinin işlenmesi sonucu sağlık alanındaki ciddi ilerlemelere rağmen gelinen seviyenin sadece başlangıç olduğu söylenebilir. Bir hasta, bir sağlık kurumuna başvurduğunda hastanın şikâyeti, hikayesi, test sonuçları, aldığı tanı, kullanılan ilaçlar, geçirdiği operasyonlar gibi birçok bilgi elektronik kayıt sistemlerinde tutulur. Bu bilgilerin bir kısmı yapılandırılmış haldedir ve kolayca makine öğrenmesi yöntemlerinde öznitelik olarak kullanılabilir. Semptomları da içeren klinik metinler ise yapılandırılmamış halde tutulmakta ve bu nedenle doğrudan makine öğrenmesi yaklaşımında kullanmaya uygun değillerdir. Hastalıkların tanısının konmasında semptomların çok büyük etkisi vardır. Bu nedenle metin içinden semptom çıkarımı yapılarak metin verilerinin yapılandırılmış hale dönüştürülmesi, makine öğrenmesi yaklaşımlarıyla hastalıkların tespit edilmesi ve tanı süreçlerinin iyileştirilmesi açısından önemli bir rol oynayacaktır. Bu kapsamda, bu tezin amacı çocuk hastalara ait Türkçe klinik metinlerden semptom çıkarımıdır. Yapılandırılmamış klinik metin verilerinden semptom çıkarımı için çeşitli doğal dil işleme teknikleri kullanılmıştır. Metin verileri toplandıktan sonra öncelikle anonimleştirilmiştir. Anonimleştirme işleminin ardından çocuk hastalıkları uzmanlarının desteğiyle veri seti üzerinden semptomlar etiketlenmiştir ve ardından temizleme, dönüştürme ve normalizasyon gibi ön-işlemler yapılmıştır. Temizlenmiş verileri makine öğrenmesi yöntemlerinde öznitelik olarak kullanmak amacıyla çeşitli vektörleştirme teknikleri aracılığıyla metinler sayısal hale dönüştürülmüştür. Son olarak karar ağaçları, destek vektör makineleri, lojistik regresyon, yapay sinir ağları ve rastgele orman yöntemi gibi toplu ağaç sınıflandırıcılarıyla semptomların varlığı-yokluğu ve varsa semptomun ne olduğu tahmin edilmiştir. Özellikle karar ağacı ve toplu ağaç sınıflandırıcılarının oldukça başarılı makine öğrenmesi modelleri geliştirdiği gözlemlenmiştir.

Özet (Çeviri)

Nowadays, many artificial intelligence-based methods have been developed for diagnosing diseases, discovering new treatments, or providing support. Despite significant advances in the healthcare field resulting from processing large amounts of health data, it can be said that the current level is only the beginning. When a patient applies to a health institution, various information such as the patient's complaints, medical history, test results, diagnosis, medications, and surgeries are recorded in electronic systems. Some of this information is structured and can easily be used as features in machine learning methods. However, clinical texts that include symptoms are kept in unstructured formats and are therefore not suitable for direct use in machine learning approaches. Symptoms play a very important role in diagnosing diseases. Extracting symptoms from text converts text data into a structured format and thus plays a significant role in identifying diseases and improving diagnosis processes through machine learning approaches. In this context, the aim of this thesis is to extract symptoms from Turkish clinical texts of pediatric patients. In this study, various natural language processing techniques were used for symptom extraction from unstructured clinical text data. After collecting the text data, they were first anonymized. After the anonymization process, symptoms were labeled in the data set with the support of pediatric specialists, and then pre-processing steps such as cleaning, transformation and normalization were carried out. The cleaned data was converted into numerical form using various vectorization techniques to be used as features in machine learning methods. Finally, decision trees, support vector machines, logistic regression, artificial neural networks, and ensemble tree classifiers such as random forests were employed to predict the presence or absence of symptoms and, if present, to identify the specific symptoms. It was observed that especially decision tree and ensemble tree classifiers developed successful machine learning models.

Benzer Tezler

Tez No
780814
Çocuklardaki genetik geçişli renal hastalıklarda hedef spesifik dizayn edilmiş yeni nesil sekanslama yönteminin klinik tanıdaki öneminin belirlenmesi
Determining the importance of a target-specific design new generation sequencing method in the clinical diagnosis of inherited renal diseases in children
MURAT ÇETİN
Tıpta Uzmanlık
Türkçe
2023
Çocuk Sağlığı ve Hastalıkları Gazi Üniversitesi
Çocuk Sağlığı ve Hastalıkları Ana Bilim Dalı
PROF. DR. HATİCE KİBRİYA FİDAN
Tez No
90283
Demir eksikliği tanısında serum transferrin reseptörünün ve onun ferritin logaritmasına oranının önemi
The Importance of serum transferrin receptor and its ratio serum ferritin in the diagnosis of iron deficiency
VİLDAN KOŞAN ÇULHA
Tıpta Uzmanlık
Türkçe
2000
Hematoloji Ankara Üniversitesi
Çocuk Sağlığı ve Hastalıkları Ana Bilim Dalı
PROF. DR. ZÜMRÜT UYSAL
Tez No
331486
Sol-sağ şantlı doğuştan kalp hastalığı olan süt çocuklarında dekonjestif tedavi öncesi ve sonrasında N Tip ProBNP düzeylerinin değerlendirilmesi
Evaluation of NT-ProBNP levels in infants with left to right shunt congenital heart disease before and after decongestive therapy
PINAR ÇOLAK
Tıpta Uzmanlık
Türkçe
2013
Çocuk Sağlığı ve Hastalıkları Çukurova Üniversitesi
Dahili Tıp Bilimleri Bölümü
PROF. DR. NAZAN ÖZBARLAS
Tez No
242060
Yenidoğan sepsisinin tanısında serum PRO-BNP (ProB tip natriüretik peptid)'in değeri
Diagnostic value of serum PRO-BNP (ProB type natriüretic peptid) levels in neonatal sepsis
İBRAHİM DEĞER
Tıpta Uzmanlık
Türkçe
2009
Çocuk Sağlığı ve Hastalıkları Yüzüncü Yıl Üniversitesi
Çocuk Sağlığı ve Hastalıkları Ana Bilim Dalı
PROF. DR. ABDULLAH CEYLAN
Tez No
920601
Mardin ve Kayseri yörelerinde immünglobulin e aracılı besin alerjisi tanısı alan hastaların klinik ve demografik verilerinin araştırılıp değerlendirilmesi
Investigation and evaluation of clinical and demographic data of patients diagnosed with immünoglobulin e-mediated food allergy in the regions of Mardin and Kayseri
SAKİNE ŞANLIKAN AKÇAY
Tıpta Uzmanlık
Türkçe
2025
Çocuk Sağlığı ve Hastalıkları Sağlık Bilimleri Üniversitesi
Çocuk Sağlığı ve Hastalıkları Ana Bilim Dalı
DOÇ. DR. MURAT CANSEVER

Geri Dön