Geri Dön

Hastalık teşhis tahminlerinde veri madenciliği sınıflandırma yöntemleri

Data mining classification methods in disease diagnostic estimates

  1. Tez No: 783274
  2. Yazar: FATMANUR DAL
  3. Danışmanlar: DR. ÖĞR. ÜYESİ OSMAN GÜRDAL
  4. Tez Türü: Yüksek Lisans
  5. Konular: Biyoistatistik, Biostatistics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2023
  8. Dil: Türkçe
  9. Üniversite: Süleyman Demirel Üniversitesi
  10. Enstitü: Sağlık Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Biyoistatistik ve Tıbbi Bilişim Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 68

Özet

Bu çalışmasında, karaciğer hastalığının erken teşhisinde seçilen temel makine öğrenme metotlarını uygulayarak, en yüksek doğruluğa sahip olan bir algoritmanın seçilmesidir. En büyük organ olan karaciğer vücutta birçok önemli görevi üstlenmektedir. Karaciğerin az miktarda çalışması dahi vücut için yeterlidir. Bu durum karaciğer hastalığının teşhisini zorlaştırmaktadır. Dünyada hastaların %4'ü karaciğer hastasıyken, ölümlerin %8'i karaciğer hastalığına bağlı olmaktadır. Karaciğer hastalıklarının ekonomiye ve insan hayatına verdiği zarar şüphesiz ki bu hastalığı erken teşhis ve tedavi açısından önemli hale getirmiştir. Makine öğrenme algoritmaları hastalıkların erken teşhisinde sıklıkla kullanılmakta olup, tıp alanındaki karmaşık verilerin anlaşılması, çözümlenebilmesi ve işlenebilmesi için sıkça başvurulan yöntemler haline gelmiştir. Bu çalışmadaki veri seti UCI'deki herkesin erişimine açık olan Indian Liver Patient Dataset (ILPD) kullanılmıştır. Veri seti Hindistan'daki 416 karaciğer hastalığı tanılı, 167 sağlıklı bireyi içermektedir. Karaciğer hastalığının sınıflandırma işlemleri için bazı makine öğrenme yöntemleri kullanılmıştır. Bu yöntemlerden, Destek Vektör Makineleri (DVM), Yapay Sinir Ağları (YSA), Naif Bayes (NB), k-En yakın komşu (k-NN), Karar Ağaçları ve Lojistik Regresyon metotları uygulanmıştır. Veri seti 10 adet bağımsız (explanatory) değişken, 1 adet bağımlı (outcome) değişkenden oluşmaktadır. Veri setinin %80'i eğitim, %20'si ise test seti olmak üzere rastgele ikiye ayrılmıştır. Kişilere ait tanımlayıcı (descriptive) istatistik bilgileri incelenmiştir. Kişilerin 142'si (%24,4) kadın, 441'i (%75,6) erkektir. En küçük yaştaki kişi 4, en büyük kişi ise 90 yaşında olup, ortalama yaş 44,75±16,19'dur. Çalışma için uygulanan makine öğrenme algoritmaları sonrasında modellerin hata matrisi oluşturuldu. Doğruluk, özgüllük, kesinlik, duyarlılık ve F skoru değerleri hesaplandı. Elde edilen doğruluk oranlarına göre karaciğer hastalığının teşhisinde kullanılması uygun görülen model YSA ve k-NN olup, değeri %72'ydi. Ancak bu modellerin F skoru incelendiğinde YSA modelinin %83 iken, k-NN modelinin %82 olduğu elde edildi. Bu durumda en güvenilir modelin YSA olduğu saptandı.

Özet (Çeviri)

In this investigation, by using basic machine learning techniques that we were able to determine the optimal algorithms for early liver disease identification. The largest organ in the body, the liver, performs a variety of crucial tasks. The body can function with even a little help from the liver. This makes the diagnosis of liver disease challenging. Despite liver illness affecting 4% of patients worldwide, it accounts for 8% of fatalities. There is no doubt that this disease is significant in terms of early detection and treatment due to the harm that liver diseases pose to the economy and human life. In the domain of medicine, machine learning algorithms are being regularly used to comprehend, analyze, and process complex data. They are also widely utilized in the early identification of diseases. The Indian Liver Patient Dataset (ILPD), which is available to everyone at UCI, provided the dataset used in this study. The dataset contained 416 liver disease diagnoses and 167 healthy individuals. To categorize liver illnesses, some machine learning algorithms have been utilized, such as Support Vector Machines (SVM), Artificial Neural Networks (ANN), Naive Bayes (NB), k-Nearest Neighbor (k-NN), Decision Trees, and Logistic Regression. There were ten explanatory variables and one outcome variable in the dataset. The dataset was randomly divided into a training set of 80% and a test set of 20%. Using descriptive statistics, we discovered that 142 (24.4%) of the individuals had liver disease and were female, while 441 (75.6%) were male. The average age was 44.75 ± 16.19 years, with the youngest person being 4 years old and the oldest person being 90 years old. Following the application of machine learning methods to the investigation, the error matrices of the models were constructed. The values for accuracy, specificity, precision, sensitivity, and F-score were computed. ANN and k-NN models with an accuracy rate of 72% were declared suitable for the diagnosis of liver disease based on the obtained accuracy rates. However, when the F scores of these models were compared, it was discovered that the ANN model had a score of 83% while the k-NN model had a score of 82%. Thus, it was concluded that the ANN was proven to be the most dependable model in this work.

Benzer Tezler

  1. Computer-aided estimation of endoscopic activity in ulcerative colitis

    Ülseratif kolit endoskopik aktivitesinin bilgisayar yardımı ile tahmin edilmesi

    GÖRKEM POLAT

    Doktora

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik Üniversitesi

    Sağlık Bilişimi Ana Bilim Dalı

    PROF. DR. ALPTEKİN TEMİZEL

  2. Train set complexity tunning for imbalance learning

    Dengesiz öğrenme için eğitim seti karmaşıklığının ayarlanması

    MEHMET ULAŞ

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Endüstri ve Endüstri Mühendisliğiİstanbul Teknik Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    DR. MEHMET ALİ ERGÜN

  3. Automated diagnostic tool for hypertension using deep learning model

    Derin öğrenme modelini kullanarak hipertansiyon için otomatik teşhis aracı

    TUĞBA YILMAZ

    Yüksek Lisans

    İngilizce

    İngilizce

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAnkara Yıldırım Beyazıt Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. BAHA ŞEN

  4. Türkiye'de HIV insidans ve prevalanslarının matematiksel modelleme ile tahmini

    Determining HIV incidence and prevalence in Turkey with mathematical modeling

    ZİKRİYE MELİSA ERDOĞAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2018

    Endüstri ve Endüstri Mühendisliğiİstanbul Teknik Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ EMİNE YAYLALI

  5. Preparation and characterization of magnetic nanoparticles with anchored antibodies for biomarker separation from body fluids

    Vücut sıvılarından biyogösterge ayrımı için antikor bağlı magnetik nanopartikül üretimi ve karakterizasyonu

    ELVAN DEMİRBAĞ

    Yüksek Lisans

    İngilizce

    İngilizce

    2013

    Kimya Mühendisliğiİstanbul Teknik Üniversitesi

    Kimya Mühendisliği Ana Bilim Dalı

    PROF. DR. ÖZGÜL ÖZCAN TAŞPINAR

    PROF. DR. PETR KACER