Hastalık teşhis tahminlerinde veri madenciliği sınıflandırma yöntemleri
Data mining classification methods in disease diagnostic estimates
- Tez No: 783274
- Danışmanlar: DR. ÖĞR. ÜYESİ OSMAN GÜRDAL
- Tez Türü: Yüksek Lisans
- Konular: Biyoistatistik, Biostatistics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2023
- Dil: Türkçe
- Üniversite: Süleyman Demirel Üniversitesi
- Enstitü: Sağlık Bilimleri Enstitüsü
- Ana Bilim Dalı: Biyoistatistik ve Tıbbi Bilişim Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 68
Özet
Bu çalışmasında, karaciğer hastalığının erken teşhisinde seçilen temel makine öğrenme metotlarını uygulayarak, en yüksek doğruluğa sahip olan bir algoritmanın seçilmesidir. En büyük organ olan karaciğer vücutta birçok önemli görevi üstlenmektedir. Karaciğerin az miktarda çalışması dahi vücut için yeterlidir. Bu durum karaciğer hastalığının teşhisini zorlaştırmaktadır. Dünyada hastaların %4'ü karaciğer hastasıyken, ölümlerin %8'i karaciğer hastalığına bağlı olmaktadır. Karaciğer hastalıklarının ekonomiye ve insan hayatına verdiği zarar şüphesiz ki bu hastalığı erken teşhis ve tedavi açısından önemli hale getirmiştir. Makine öğrenme algoritmaları hastalıkların erken teşhisinde sıklıkla kullanılmakta olup, tıp alanındaki karmaşık verilerin anlaşılması, çözümlenebilmesi ve işlenebilmesi için sıkça başvurulan yöntemler haline gelmiştir. Bu çalışmadaki veri seti UCI'deki herkesin erişimine açık olan Indian Liver Patient Dataset (ILPD) kullanılmıştır. Veri seti Hindistan'daki 416 karaciğer hastalığı tanılı, 167 sağlıklı bireyi içermektedir. Karaciğer hastalığının sınıflandırma işlemleri için bazı makine öğrenme yöntemleri kullanılmıştır. Bu yöntemlerden, Destek Vektör Makineleri (DVM), Yapay Sinir Ağları (YSA), Naif Bayes (NB), k-En yakın komşu (k-NN), Karar Ağaçları ve Lojistik Regresyon metotları uygulanmıştır. Veri seti 10 adet bağımsız (explanatory) değişken, 1 adet bağımlı (outcome) değişkenden oluşmaktadır. Veri setinin %80'i eğitim, %20'si ise test seti olmak üzere rastgele ikiye ayrılmıştır. Kişilere ait tanımlayıcı (descriptive) istatistik bilgileri incelenmiştir. Kişilerin 142'si (%24,4) kadın, 441'i (%75,6) erkektir. En küçük yaştaki kişi 4, en büyük kişi ise 90 yaşında olup, ortalama yaş 44,75±16,19'dur. Çalışma için uygulanan makine öğrenme algoritmaları sonrasında modellerin hata matrisi oluşturuldu. Doğruluk, özgüllük, kesinlik, duyarlılık ve F skoru değerleri hesaplandı. Elde edilen doğruluk oranlarına göre karaciğer hastalığının teşhisinde kullanılması uygun görülen model YSA ve k-NN olup, değeri %72'ydi. Ancak bu modellerin F skoru incelendiğinde YSA modelinin %83 iken, k-NN modelinin %82 olduğu elde edildi. Bu durumda en güvenilir modelin YSA olduğu saptandı.
Özet (Çeviri)
In this investigation, by using basic machine learning techniques that we were able to determine the optimal algorithms for early liver disease identification. The largest organ in the body, the liver, performs a variety of crucial tasks. The body can function with even a little help from the liver. This makes the diagnosis of liver disease challenging. Despite liver illness affecting 4% of patients worldwide, it accounts for 8% of fatalities. There is no doubt that this disease is significant in terms of early detection and treatment due to the harm that liver diseases pose to the economy and human life. In the domain of medicine, machine learning algorithms are being regularly used to comprehend, analyze, and process complex data. They are also widely utilized in the early identification of diseases. The Indian Liver Patient Dataset (ILPD), which is available to everyone at UCI, provided the dataset used in this study. The dataset contained 416 liver disease diagnoses and 167 healthy individuals. To categorize liver illnesses, some machine learning algorithms have been utilized, such as Support Vector Machines (SVM), Artificial Neural Networks (ANN), Naive Bayes (NB), k-Nearest Neighbor (k-NN), Decision Trees, and Logistic Regression. There were ten explanatory variables and one outcome variable in the dataset. The dataset was randomly divided into a training set of 80% and a test set of 20%. Using descriptive statistics, we discovered that 142 (24.4%) of the individuals had liver disease and were female, while 441 (75.6%) were male. The average age was 44.75 ± 16.19 years, with the youngest person being 4 years old and the oldest person being 90 years old. Following the application of machine learning methods to the investigation, the error matrices of the models were constructed. The values for accuracy, specificity, precision, sensitivity, and F-score were computed. ANN and k-NN models with an accuracy rate of 72% were declared suitable for the diagnosis of liver disease based on the obtained accuracy rates. However, when the F scores of these models were compared, it was discovered that the ANN model had a score of 83% while the k-NN model had a score of 82%. Thus, it was concluded that the ANN was proven to be the most dependable model in this work.
Benzer Tezler
- Computer-aided estimation of endoscopic activity in ulcerative colitis
Ülseratif kolit endoskopik aktivitesinin bilgisayar yardımı ile tahmin edilmesi
GÖRKEM POLAT
Doktora
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik ÜniversitesiSağlık Bilişimi Ana Bilim Dalı
PROF. DR. ALPTEKİN TEMİZEL
- Train set complexity tunning for imbalance learning
Dengesiz öğrenme için eğitim seti karmaşıklığının ayarlanması
MEHMET ULAŞ
Yüksek Lisans
İngilizce
2024
Endüstri ve Endüstri Mühendisliğiİstanbul Teknik ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
DR. MEHMET ALİ ERGÜN
- Automated diagnostic tool for hypertension using deep learning model
Derin öğrenme modelini kullanarak hipertansiyon için otomatik teşhis aracı
TUĞBA YILMAZ
Yüksek Lisans
İngilizce
2021
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAnkara Yıldırım Beyazıt ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. BAHA ŞEN
- Türkiye'de HIV insidans ve prevalanslarının matematiksel modelleme ile tahmini
Determining HIV incidence and prevalence in Turkey with mathematical modeling
ZİKRİYE MELİSA ERDOĞAN
Yüksek Lisans
Türkçe
2018
Endüstri ve Endüstri Mühendisliğiİstanbul Teknik ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ EMİNE YAYLALI
- Preparation and characterization of magnetic nanoparticles with anchored antibodies for biomarker separation from body fluids
Vücut sıvılarından biyogösterge ayrımı için antikor bağlı magnetik nanopartikül üretimi ve karakterizasyonu
ELVAN DEMİRBAĞ
Yüksek Lisans
İngilizce
2013
Kimya Mühendisliğiİstanbul Teknik ÜniversitesiKimya Mühendisliği Ana Bilim Dalı
PROF. DR. ÖZGÜL ÖZCAN TAŞPINAR
PROF. DR. PETR KACER