Çocuk hastaların tanısının belirlenmesinde hasta verilerindeki özniteliklerin çıkarılması
Feature extraction from patient data for diagnosing pediatric patients
- Tez No: 888548
- Danışmanlar: DOÇ. DR. BİROL ASLANYÜREK, DOÇ. DR. EMRAH AYDIN
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Çocuk Cerrahisi, İstatistik, Computer Engineering and Computer Science and Control, Pediatric Surgery, Statistics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2024
- Dil: Türkçe
- Üniversite: Yıldız Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Matematik Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Matematik Mühendisliği Bilim Dalı
- Sayfa Sayısı: 57
Özet
Günümüzde hastalıkların teşhis edilmesi, yeni tedaviler bulunması veya sağlık çalışanlarına destek olunması amacıyla çok fazla sayıda yapay zekâ temelli yöntem geliştirilmiştir. Büyük miktardaki sağlık verilerinin işlenmesi sonucu sağlık alanındaki ciddi ilerlemelere rağmen gelinen seviyenin sadece başlangıç olduğu söylenebilir. Bir hasta, bir sağlık kurumuna başvurduğunda hastanın şikâyeti, hikayesi, test sonuçları, aldığı tanı, kullanılan ilaçlar, geçirdiği operasyonlar gibi birçok bilgi elektronik kayıt sistemlerinde tutulur. Bu bilgilerin bir kısmı yapılandırılmış haldedir ve kolayca makine öğrenmesi yöntemlerinde öznitelik olarak kullanılabilir. Semptomları da içeren klinik metinler ise yapılandırılmamış halde tutulmakta ve bu nedenle doğrudan makine öğrenmesi yaklaşımında kullanmaya uygun değillerdir. Hastalıkların tanısının konmasında semptomların çok büyük etkisi vardır. Bu nedenle metin içinden semptom çıkarımı yapılarak metin verilerinin yapılandırılmış hale dönüştürülmesi, makine öğrenmesi yaklaşımlarıyla hastalıkların tespit edilmesi ve tanı süreçlerinin iyileştirilmesi açısından önemli bir rol oynayacaktır. Bu kapsamda, bu tezin amacı çocuk hastalara ait Türkçe klinik metinlerden semptom çıkarımıdır. Yapılandırılmamış klinik metin verilerinden semptom çıkarımı için çeşitli doğal dil işleme teknikleri kullanılmıştır. Metin verileri toplandıktan sonra öncelikle anonimleştirilmiştir. Anonimleştirme işleminin ardından çocuk hastalıkları uzmanlarının desteğiyle veri seti üzerinden semptomlar etiketlenmiştir ve ardından temizleme, dönüştürme ve normalizasyon gibi ön-işlemler yapılmıştır. Temizlenmiş verileri makine öğrenmesi yöntemlerinde öznitelik olarak kullanmak amacıyla çeşitli vektörleştirme teknikleri aracılığıyla metinler sayısal hale dönüştürülmüştür. Son olarak karar ağaçları, destek vektör makineleri, lojistik regresyon, yapay sinir ağları ve rastgele orman yöntemi gibi toplu ağaç sınıflandırıcılarıyla semptomların varlığı-yokluğu ve varsa semptomun ne olduğu tahmin edilmiştir. Özellikle karar ağacı ve toplu ağaç sınıflandırıcılarının oldukça başarılı makine öğrenmesi modelleri geliştirdiği gözlemlenmiştir.
Özet (Çeviri)
Nowadays, many artificial intelligence-based methods have been developed for diagnosing diseases, discovering new treatments, or providing support. Despite significant advances in the healthcare field resulting from processing large amounts of health data, it can be said that the current level is only the beginning. When a patient applies to a health institution, various information such as the patient's complaints, medical history, test results, diagnosis, medications, and surgeries are recorded in electronic systems. Some of this information is structured and can easily be used as features in machine learning methods. However, clinical texts that include symptoms are kept in unstructured formats and are therefore not suitable for direct use in machine learning approaches. Symptoms play a very important role in diagnosing diseases. Extracting symptoms from text converts text data into a structured format and thus plays a significant role in identifying diseases and improving diagnosis processes through machine learning approaches. In this context, the aim of this thesis is to extract symptoms from Turkish clinical texts of pediatric patients. In this study, various natural language processing techniques were used for symptom extraction from unstructured clinical text data. After collecting the text data, they were first anonymized. After the anonymization process, symptoms were labeled in the data set with the support of pediatric specialists, and then pre-processing steps such as cleaning, transformation and normalization were carried out. The cleaned data was converted into numerical form using various vectorization techniques to be used as features in machine learning methods. Finally, decision trees, support vector machines, logistic regression, artificial neural networks, and ensemble tree classifiers such as random forests were employed to predict the presence or absence of symptoms and, if present, to identify the specific symptoms. It was observed that especially decision tree and ensemble tree classifiers developed successful machine learning models.
Benzer Tezler
- Çocuklardaki genetik geçişli renal hastalıklarda hedef spesifik dizayn edilmiş yeni nesil sekanslama yönteminin klinik tanıdaki öneminin belirlenmesi
Determining the importance of a target-specific design new generation sequencing method in the clinical diagnosis of inherited renal diseases in children
MURAT ÇETİN
Tıpta Uzmanlık
Türkçe
2023
Çocuk Sağlığı ve HastalıklarıGazi ÜniversitesiÇocuk Sağlığı ve Hastalıkları Ana Bilim Dalı
PROF. DR. HATİCE KİBRİYA FİDAN
- Demir eksikliği tanısında serum transferrin reseptörünün ve onun ferritin logaritmasına oranının önemi
The Importance of serum transferrin receptor and its ratio serum ferritin in the diagnosis of iron deficiency
VİLDAN KOŞAN ÇULHA
Tıpta Uzmanlık
Türkçe
2000
HematolojiAnkara ÜniversitesiÇocuk Sağlığı ve Hastalıkları Ana Bilim Dalı
PROF. DR. ZÜMRÜT UYSAL
- Sol-sağ şantlı doğuştan kalp hastalığı olan süt çocuklarında dekonjestif tedavi öncesi ve sonrasında N Tip ProBNP düzeylerinin değerlendirilmesi
Evaluation of NT-ProBNP levels in infants with left to right shunt congenital heart disease before and after decongestive therapy
PINAR ÇOLAK
Tıpta Uzmanlık
Türkçe
2013
Çocuk Sağlığı ve HastalıklarıÇukurova ÜniversitesiDahili Tıp Bilimleri Bölümü
PROF. DR. NAZAN ÖZBARLAS
- Yenidoğan sepsisinin tanısında serum PRO-BNP (ProB tip natriüretik peptid)'in değeri
Diagnostic value of serum PRO-BNP (ProB type natriüretic peptid) levels in neonatal sepsis
İBRAHİM DEĞER
Tıpta Uzmanlık
Türkçe
2009
Çocuk Sağlığı ve HastalıklarıYüzüncü Yıl ÜniversitesiÇocuk Sağlığı ve Hastalıkları Ana Bilim Dalı
PROF. DR. ABDULLAH CEYLAN
- Biyotinidaz eksikliği tanılı hastaların klinik, laboratuvar bulguları ile uzun dönem izlem sonuçlarının değerlendirilmesi
Evaluation of clinical and laboratory findings and LONG-TERM follow-up results of patients diagnosed with biotinidase deficiency
AGSHIN RZAYEV
Tıpta Uzmanlık
Türkçe
2021
Çocuk Sağlığı ve Hastalıklarıİstanbul Üniversitesi-CerrahpaşaÇocuk Sağlığı ve Hastalıkları Ana Bilim Dalı
DOÇ. DR. AYŞE ÇİĞDEM AKTUĞLU ZEYBEK