Karaciğer hastalığı teşhisinde makine öğrenmesi yöntemlerinin başarılarının ölçülmesi
Measuring the success of machine learning methods in diagnosing liver disease
- Tez No: 688824
- Danışmanlar: DR. ÖĞR. ÜYESİ MUHAMMET BAYKARA
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2021
- Dil: Türkçe
- Üniversite: Fırat Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Yazılım Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 82
Özet
Karaciğer, vücudumuzda pek çok fizyolojik ve metabolik süreçte hayati görevler üstlenir. Karaciğer eksikliği ya da karaciğerin işlevsel bozuklukları sağlık sorunlarına ve nihayetinde hastalıklara yol açmaktadır. Karaciğer hastalıklarının erken dönemde teşhisi, gereksiz ilaç kullanımını azaltarak hem tedavi süresinin kısaltılmasında hem de karaciğer tahribatının engellenmesinde etkili olabilmektedir. Gelişen teknoloji ile beraber tıp dünyasında makine öğrenmesi yöntemleri hastalıkların teşhisinde büyük bir başarı sağlamaktadır. Bu çalışmada, son yıllarda oldukça çok sık görülen karaciğer hastalıklarının erken teşhis edilmesi amaçlanmaktadır. Veri seti olarak UCI'de herkesin erişimine açık olan Indian Liver Patient Dataset (ILPD) kullanılmıştır. Veri setinde 583 adet örnek hasta kaydı vardır. Hastalık teşhis başarısını arttırmak amacıyla veri setlerinde bulunan öznitelikler üzerinde sarmal özellik seçme yöntemleri kullanarak teşhis başarısını arttıracak öznitelikler belirlenmiştir. Belirlenen önemli öz nitelikler üzerinde makine öğrenmesi yöntemleri uygulanarak karaciğer hastalığı teşhis başarıları ölçülmüştür. Makine öğrenmesi yöntemlerinde model iyileştirilmesi yapılarak hastalık teşhis başarıları arttırılmıştır. Karaciğer hastalığının sınıflandırma işlemleri için makine öğrenmesi yöntemleri kullanılmıştır. Makine öğrenmesi yöntemlerinden Destek Vektör Makinası (SVM), Çok Katmanlı Algılayıcı (MLP), Karar Ağaçları (DT), Lojistik Regresyon (LR) ve Hafif Gradyan Güçlendirme Makinesi Sınıflandırıcısı (LGBM) yöntemleri uygulanmıştır. Çalışmanın birinci bölümünde tezin amacı, önemi vurgulandıktan sonra literatürde yapılmış benzer çalışmalara yer verilmiştir. İkinci bölümünde ise karaciğer ve hastalıkları hakkında bilgiler verilmiştir. Üçüncü bölümde makine öğrenmesi ve türleri, veri seti bilgisi, özellik seçimi ve bu çalışmada kullanılan makine öğrenmesi yöntemleri hakkında bilgiler anlatılmıştır. Dördüncü bölümde ise uygulamalar 3 aşamaya ayrılmış olup birinci uygulamada makine öğrenmesi yöntemleri orjinal veri setine uygulanmış ve sonuçları elde edilmiştir. İkinci uygulamada özellik seçimi ile veri setinden önemli öz nitelikler seçilmiş ve bu önemli öz nitelikler kullanılarak veri setinin bir alt kümesi oluşturulmuştur. Oluşturulan alt kümeye makine öğrenmesi yöntemleri uygulanmıştır. Üçüncü uygulamada, ikinci uygulamada uygulanan makine öğrenmesi yöntemlerine hiper parametre optimizasyonu uygulanarak model iyileştirilmesi sonucunda modeller yeniden kurulmuş, doğruluk performansları ölçülmüştür. Beşinci bölümde yani sonuç bölümünde ise hiper parametre optimizasyonu sonucu elde edilen hiper parametreler ile model iyileştirilmesi yapılarak sınıflandırma algoritmalarının doğruluk performans sonuçları, ilk iki uygulama ile ve literatürde ILPD veri seti ile yapılan çalışmaların sonuçları karşılaştırılmıştır.
Özet (Çeviri)
The liver plays a vital role in many physiological and metabolic processes in our body. Liver deficiency or functional disorders of the liver lead to health problems and eventually diseases. Early diagnosis of liver diseases can be effective in both shortening the treatment period and preventing liver damage by reducing unnecessary drug use. With the developing technology, machine learning methods in the medical world provide a great success in the diagnosis of diseases. In this study, it is aimed to detect early liver diseases, which are very common in recent years. The Indian Liver Patient Dataset (ILPD), which is accessible to everyone at UCI, was used as the data set. There are 583 sample patient records in the data set. In order to increase the success of disease diagnosis, features that will increase the success of diagnosis were determined by using spiral feature selection methods on the features in the data sets. The success of diagnosing liver disease was measured by applying machine learning methods on the determined important attributes. The success of disease diagnosis has been increased by improving the model in machine learning methods. Machine learning methods were used for classification processes of liver disease. Among the machine learning methods, Support Vector Machine (SVM), Multilayer Perceptron (MLP), Decision Trees (DT), Logistic Regression (LR) and Light Gradient Enhancement Machine Classifier (LGBM) methods were applied. In the first part of the study, after emphasizing the purpose and importance of the thesis, similar studies in the literature are included. In the second part, information about the liver and its diseases is given. In the third chapter, information about machine learning and its types, data set information, feature selection and machine learning methods used in this study are explained. In the fourth part, the applications are divided into 3 stages, and in the first application, machine learning methods are applied to the original data set and the results are obtained. In the second application, important features were selected from the data set with feature selection and a subset of the data set was created by using these important features. Machine learning methods were applied to the created subset. In the third application, hyperparameter optimization was applied to the machine learning methods applied in the second application, and as a result of the model improvement, the models were reconstructed and their accuracy performances were measured. In the fifth part, namely the conclusion part, the accuracy performance results of the classification algorithms, the results of the studies conducted with the first two applications and the ILPD data set in the literature, were compared by making the model improvement with the hyper parameters obtained as a result of hyper parameter optimization.
Benzer Tezler
- Metagenom verisinden yüksek çözünürlüklü biyobelirteç keşif algoritmaları
Algorithms for discovery of high resolution biomarkers from metagenomic data
AYŞENUR SOYTÜRK
Yüksek Lisans
Türkçe
2020
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolErciyes ÜniversitesiBiyoinformatik Sistemler Biyolojisi Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ÖZKAN UFUK NALBANTOĞLU
- Hard and soft tissue characterization with microwave dielectric spectroscopy
Mikrodalga dielektrik spektroskopi ile sert ve yumuşak doku karakterizasyonu
SEDA KESKİN
Yüksek Lisans
İngilizce
2022
Biyomühendislikİstanbul Teknik ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
PROF. DR. TAYFUN AKGÜL
- Non alkolik steatohepatit (NASH) hastalarında anlamlı-ileri fibrozis verileri için makine öğrenmesi yöntemlerinin karşılaştırılması
The graduate school of natural and applied science of selçuk university the degree of master of science in biomedical engineering
KEMAL TOLGA ÇETİN
Yüksek Lisans
Türkçe
2023
Mühendislik BilimleriSelçuk ÜniversitesiBiyomedikal Mühendisliği Ana Bilim Dalı
PROF. DR. ŞAKİR TAŞDEMİR
- Multiclass classification of hepatic anomalies based on in vivo microwave dielectric properties
Hepatik anomalilerin in vivo mikrodalga dielektrik özelliklerine dayalı çok sınıflı sınıflandırılması
ZEYNEP GÜLSÜM BİLGEN
Yüksek Lisans
İngilizce
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ TUBA YILMAZ ABDOLSAHEB
- Breast cancer data classification using SVM, NB and KNN algorithms
SVM, NB ve KNN kullanımı ile göğüs kanseri veri sınıflandırması
BURCU MERAL
Yüksek Lisans
İngilizce
2019
Bilim ve Teknolojiİstanbul Teknik ÜniversitesiMatematik Mühendisliği Ana Bilim Dalı
PROF. DR. KAMİL ORUÇOĞLU