Cancer diagnosis and classification using ML-based natural language processing: A case study at an Iraqi hospital
ML tabanlı doğal dil işleme kullanılarak kanser tanısı ve sınıflandırılması: Irak'ta bir hastanede bir vaka çalışması
- Tez No: 876259
- Danışmanlar: PROF. DR. MUSTAFA ÖZBAYRAK
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2024
- Dil: İngilizce
- Üniversite: Bahçeşehir Üniversitesi
- Enstitü: Lisansüstü Eğitim Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
- Sayfa Sayısı: 122
Özet
Kanserli tümörler dünya çapında her yıl artarak insanlar arasındaki ölüm oranını artırıyor. Son zamanlarda araştırmacılar, hastalık teşhis sonuçlarını içeren resmi tıbbi belgeler olan radyolojik raporlardan kanserli tümörleri tespit etmek ve teşhis etmek için çerçeveler geliştirdiler. Tedaviyi yapan hekim ile uzman hekim arasındaki standart iletişim yöntemi olarak kabul edilir. Doğal Dil İşleme (NLP) önemli gelişmeler kaydetti; Ancak radyoloji raporlarının karmaşık yapısı nedeniyle kanser teşhis sürecini otomatikleştirmek karmaşık bir görev olmaya devam ediyor. Bu çalışma, serbest metin radyoloji raporlarından vücudun tüm organlarındaki kanserlerin türüne göre (iyi huylu veya kötü huylu) ve tedavi yanıtına göre (stabil, iyileşen veya ilerleyen) kanser tanısına yönelik çok sınıflı sınıflandırma yöntemleri geliştirmeyi amaçlamaktadır. NLP özellik çıkarımı TF-IDF ve (Word2vec, Glove, FastText) Kelime Gömmelerine dayalı olarak çeşitli makine öğrenimi sınıflandırıcılarının (XGBoost, LightGBM, SVM ve oylamayı kullanarak topluluk öğrenimi) eğitimi. Bu çalışmaya Irak hastanelerinden 2017-2022 tarihlerine ait MR, CT ve ultrason cihazlarından alınan 13223 radyoloji raporu dahil edilmiştir. Sınıflandırmanın kalitesi doğruluk, F1 puanı, kesinlik, hatırlama ve AUC gibi değerlendirme ölçümleri kullanılarak değerlendirildi. Sonuçlar, TF-IDF'nin tüm sınıflandırıcılarla Word Embeddings tekniklerinden daha iyi performans gösterdiğini ve en iyi performansın, topluluk öğrenme sınıflandırıcısı ve TF-IDF modeli için 97,3 doğrulukla olduğunu gösterdi. Bunu 97,25 doğrulukla TF-IDF'li XGBoost sınıflandırıcı takip ediyor. Sonuç, farklı NLP tabanlı sınıflandırıcıların kanser teşhisi ve ilerlemesindeki etkinliği hakkında fikir veriyor. Bu alandaki çalışmamız, tıbbi raporların tedavisini geliştirmek ve sağlık hizmetlerine öncelik vermek için araçlar ve bilgiler sağlamayı amaçlamaktadır. Bu çalışma, Irak'ta ilk olma özelliğiyle radyolojik raporlardan kanser tanısının konulmasına katkı sağlıyor.
Özet (Çeviri)
Cancerous tumors increase every year worldwide, increasing the death rate among humans. Recently, researchers have developed frameworks for detecting and diagnosing cancerous tumors from radiological reports, which are the official medical documents that contain the disease diagnostic results. This is considered the standard method of communication between the treating physician and the specialist physician. Natural Language Processing (NLP) has seen significant developments; However, automating the cancer diagnosis process remains a complex task due to the complex nature of radiology reports. This study aims to develop multi-class classification methods to cancer diagnosis in all organs of the body into (benign or malignant) according to the type and (stable, improvement, or progress) according into treatment response from free-text radiology reports.By training various machine learning classifiers ( XGBoost, LightGBM, SVM, and ensemble learning using voting) based on NLP feature extraction TF-IDF and (Word2vec, Glove, FastText) Word Embeddings. This study included 13223 radiology reports from MRI, CT, and ultrasound devices dated 2017 to 2022 from the Iraqi hospitals. The quality of the classification was evaluated using evaluation metrics such as accuracy, F1-score, precision, recall, and AUC. The results showed that TF-IDF outperformed Word Embeddings techinqes with all classifiers, and the best performance was for the ensemble learning classifier and the TF-IDF model with an accuracy of 97.3. followed by the XGBoost classifier with TF-IDF with an accuracy of 97.25. The outcome provides insight into the effectiveness of different NLP-based classifiers in cancer diagnosis and progression. Our study in this area aims to provide tools and insights to enhance the treatment of medical reports and prioritize health care. This study contributes, as it is the first in Iraq, to diagnosing cancer from radiological reports.
Benzer Tezler
- Analysis of leukemia cancer classification with supervised machine learning and deep reinforcement learning based on gene expression monitoring (via DNA microarray)
Denetimli makine öğrenimi ve gen ifade izlemeye dayalı derin takviyeli öğrenme ile lösemi kanseri sınıflandırmasının analizi (DNA mikrodizisi aracılığıyla)
ZAID MOHAMMED IBRAHIM IBRAHIM
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolÇukurova ÜniversitesiElektrik ve Elektronik Mühendisliği Ana Bilim Dalı
PROF. DR. ULUS ÇEVİK
PROF. DR. TURGAY İBRİKÇİ
- Microwave dielectric property based classification of prostate cancer with phantom materials
Mikrodalga dielektrik özellik bazlı fantom materyallerle prostat kanseri sınıflandırılması
NEGAR VARSHABI
Yüksek Lisans
İngilizce
2021
Biyomühendislikİstanbul Teknik ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
PROF. DR. İBRAHİM AKDUMAN
- Makine öğrenimi tabanlı modeller ile prostat kanserinde, prostat biyopsisi sonrası upgrade / upstage durumlarını predikte eden faktörlerin tahmini
Prediction of factors associated with upgrade/upstage status after prostate biopsy in prostate cancer based on machine learning models
KADİR ERYILMAZ
Tıpta Uzmanlık
Türkçe
2024
ÜrolojiSüleyman Demirel ÜniversitesiÜroloji Ana Bilim Dalı
PROF. DR. ALPER ÖZORAK
- Predicting von hippel lindau (VHL), polybromo-1 (PBRM1)mutations and stages of clear cell renal cell carcinomafrom computed tomography images by machine learning
Bilgisayarli tomografi görüntülerinden makine ögrenmesi ileberrak hücreli böbrek karsinomun von hippel lindau (VHL)ve polybromo-1 (PBRM1) mutasyonlarinin ve evrelerinintahmin edilmesi
HARİKA BESTE ÖKMEN
Yüksek Lisans
İngilizce
2019
BiyomühendislikBoğaziçi ÜniversitesiBiyomedikal Mühendisliği Ana Bilim Dalı
DOÇ. DR. ALBERT GÜVENİŞ
- Skin lesion classification with machine learning
Makine öğrenmesi ile cilt lezyonu sınıflandırması
ESRA SENDEL
Yüksek Lisans
İngilizce
2023
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
DOÇ. DR. İSA YILDIRIM