Solunum sistemi hastalıklarının sınıflandırılmasında makine öğrenmesi yöntemlerinin kullanımı
Use of machine learning methods in classification of respiratory system diseases
- Tez No: 666088
- Danışmanlar: PROF. DR. ERAY YURTSEVEN
- Tez Türü: Doktora
- Konular: Biyoistatistik, Biostatistics
- Anahtar Kelimeler: astım, KOAH, pnömoni, hastalık tahmini, makine öğrenmesi, özellik seçimi, asthma, COPD, pneumonia, disease prediction, machine learning, feature selection
- Yıl: 2021
- Dil: Türkçe
- Üniversite: İstanbul Üniversitesi
- Enstitü: Sağlık Bilimleri Enstitüsü
- Ana Bilim Dalı: Biyoistatistik Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 78
Özet
En sık görülen solunum yolu hastalıkları olan astım, KOAH ve pnömoni (zatürre) gibi hastalıkların tanısı ve sınıflandırılması hayati öneme sahiptir. Son zamanlarda, bu önem nedeniyle sağlık verilerinin işlenmesine büyük ilgi gösterilmiştir. Makine öğrenmesi algoritmaları, bu amaç için önemli bir yere sahiptir. Önceki çalışmaların odağı astım, KOAH ve pnömoni hastalıklarının teşhisinde en öngörücü algoritmayı elde etmektir. Ancak, en önemli değişkenlerin belirlenmesi çok az ilgi görmüştür. Bu çalışmanın temel amacı, en önemli makine öğrenmesi algoritmalarını değişken önemine sahip sonuçlarla ayrıntılı olarak sunmaktır. Makine öğrenme algoritmalarına ve değişken önemi değerlendirmelerine dayalı kapsamlı bir karşılaştırma çalışması, doğruluk, precision(kesinlik), recall(duyarlılık), Kappa istatistikleri, F-ölçüsü, ROC eğrisi ve AUC değeri gibi farklı performans kriterleri dikkate alınarak yapılmıştır. Sağlıklı grup ile hastalıkların sınıflandırılmasında, astım hastalığı için rastgele orman (CART öğrenen ile) ve C5.0, KOAH için SVM (doğrusal olmayan çekirdek ile) ve GBM ve pnömoni hastalığı için Bagging ve Random Forest (CART öğrenen ile) en iyi algoritmalar olarak bulunmuştur. Ayrıca, tüm gupların birlikte sınıflandırılmasında en iyi test edilen algoritma GBM'dir. Değişken önemlilikleri dikkate alındığında sağlıklı grup ile hastalıklar arasında astım vakası sınıflandırma sonuçlarına göre, en önemli değişkenler FEV3, FVC, FEV1, MEF50 dır. KOAH'da MEF50, FVC, FEV3, PIF ve FEV1, pnömonide ise FVC, FEV3, MEF50 ve FEV1 dikkate değer değişkenlerdir. Tüm grupların birlikte sınıflandırmasında ise neredeyse tıbbi değişkenlerin hepsi büyük öneme sahiptir. Önemli değişkenlerin sırası, korelasyon analizi ve istatistiksel anlamlılık testleriyle desteklenmiştir. Ek olarak, ROC eğrileri ve AUC değerleri görsel olarak benzer ve destekleyici sonuçlar vermiştir. Sonuç olarak, bu çalışma sağlık bilimleri ve makine öğrenimi uygulamaları konusunda uzman sistemler üzerinde çalışan uygulayıcılar ve araştırmacılar için değerli olacaktır.
Özet (Çeviri)
The diagnosis and classification of asthma, COPD and pneumonia, which are the most common respiratory diseases, has been vital importance. Recently, there has been great interest for processing health data due to this importance. Machine learning algorithms have an important place for this purpose. The focus of previous studies has been to obtain the most predictive algorithm for diagnosing asthma, COPD and pneumonia diseases. However, the determination of the most significant variables has received little attention. The principal objective of this study is to present the most predictive machine learning algorithms with variable importance results in details. A comprehensive comparison study based on the machine learning algorithms and variable importance evaluations have been carried out by considering different performance criteria including accuracy, precision, recall, Kappa statistics, F-measure, ROC curve and AUC value. The findings have been indicated that Random forest (with CART learner), C5.0 for asthma disease and SVM (with non-linear kernel), GBM for COPD disease and Bagging ve Random Forest (with CART learner) for pneumonia have been found as the best algorithms. Also, GBM is the best tested algorithm for the classification of all groups together. Considering the variable significance, the most important variables were FEV3, FVC, FEV1, MEF50 according to the classification results of asthma cases between healthy group and diseases. MEF50, FVC, FEV3, PIF and FEV1 in COPD and FVC, FEV3, MEF50 and FEV1 in pneumonia are remarkable variables. Almost all medical variables are of great importance in the classification of all groups. The rank of important variables has been supported by correlation analysis and statistical significance tests. Additionally, ROC curves and AUC values have provided similar and supportive results as visually. Consequently, this study will be of value to practitioners and researchers studying on expert systems on health sciences and machine learning applications.
Benzer Tezler
- Prediction of COVID 19 disease using chest X-ray images based on deep learning
Derin öğrenmeye dayalı göğüs röntgen görüntüleri kullanarak COVID 19 hastalığının tahmini
ISMAEL ABDULLAH MOHAMMED AL-RAWE
Yüksek Lisans
İngilizce
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. ADEM TEKEREK
- Uzaktan algılama ve derin öğrenme yöntemleri ile İstanbul'un yerel iklim alanları ve yer yüzeyi sıcaklığı değişimleri arasındaki ilişkinin incelenmesi
Investigation of the relationship between local climate zones and land surface temperature changes in İstanbul using remote sensing and deep learning methods
MELİKE NİCANCI SİNANOĞLU
Yüksek Lisans
Türkçe
2024
Jeodezi ve Fotogrametriİstanbul Teknik Üniversitesiİletişim Sistemleri Ana Bilim Dalı
PROF. DR. ŞİNASİ KAYA
- A new respiratory diseases detection model in chest x-ray images using CNN
CNN kullanarak göğüs röntgen görüntülerinde yeni bir solunum hastalığı tespit modeli
AHMED ABDULATEEF ALZABAQ
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKarabük ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ İSA AVCI
- Türkiye Jokey Kulübü (TJK) İstanbul At Hastanesi laboratuvarına gönderilen numunelerdeki bakteriyel etkenlerin ve teşhis edilen hastalıkların dağılımı: Retrospektif bir çalışma (2015-2019)
Distribution of bacterial agents and diagnosed diseases in samples sent to the Jockey Club of Türkiye (JCT) İstanbul Equine Hospital laboratory: A retrospective study (2015-2019)
MUSTAFA CEM TİMUR
Yüksek Lisans
Türkçe
2024
Veteriner HekimliğiErciyes Üniversitesiİç Hastalıkları (Veterinerlik) Ana Bilim Dalı
DR. ÖĞR. ÜYESİ GENCAY EKİNCİ
- Multivariate modeling and diagnostic classification of pulmonary sounds
Solunum seslerinin çok değişkenli modellenmesi ve tanıya yönelik sınıflandırılması
İPEK ŞEN
Doktora
İngilizce
2013
Elektrik ve Elektronik MühendisliğiBoğaziçi ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
PROF. DR. ZEYNEP YASEMİN KAHYA
DOÇ. DR. MURAT SARAÇLAR