Geri Dön

Veri madenciliğinde sınıflandırma algoritmaları kullanılarak hepatit hastalığının tespiti

Detection of hepatitis disease using classification algorithms in data mining

  1. Tez No: 507111
  2. Yazar: SEMA GÜZEL
  3. Danışmanlar: DOÇ. DR. AHMET ALKAN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2018
  8. Dil: Türkçe
  9. Üniversite: Kahramanmaraş Sütçü İmam Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 84

Özet

Bu tez çalışmasında, tıbbi karar destek sistemlerinde kullanılan veri madenciliği teknikleri ile hastanın hepatit hastalığının ölümcül olup olmadığının teşhisi için veri seti analizi gerçekleştirilmiştir. Çalışmada kullanılan hepatit veri seti, genel erişime açık olan UCI veri tabanından (ftp://ftp.ics.uci.edu/pub/machine-learning-databases) alınmıştır. Hepatit, vücudumuzun en önemli organlarından birisi olan karaciğerin iltihaplanmasıdır. Bu iltihaplanma erken teşhis edilmesi durumunda iyileşme gösterebilirken, hastalığın ileriki safhalarında karaciğerde kalıcı hasara neden olmakla birlikte ölümle de sonuçlanabilir. Hepatitin A, B, C, D ve E olmak üzere beş tipi bulunmaktadır. Çalışmada kullanılan veri seti hepatit hastalarına ait birtakım hastalık belirtileri bilgileri, kandaki değerler ve ultrasonik tetkikle ilgili bilgilerden oluşmaktadır. Bu veri seti iki sınıfa ait 19 özellik ve toplam 155 adet örnek içermektedir. Başarılı bir tanı için veri setine ortalama değer ön işlemi uygulanarak eksik olan verilerin tamamlanması sağlanmıştır. Tamamlanmış verilere veri madenciliği sınıflandırma tekniklerinden olan karar ağacı, k en yakın komşu (K-NN) , naive bayes, çok katmanlı yapay sinir ağları, yerine koyarak örnekleme (bagging) ve rastgele altuzaylar (random subspaces) algoritmaları uygulanmıştır. Bu algoritmaların veri setine uygulanması veri madenciliği uygulamaları geliştirme programlarından WEKA programı kullanılarak gerçekleştirilmiştir. Uygulanan sınıflandırma yöntemlerinin hepatit hastalığının ölümcül olup olmadığına ilişkin teşhis başarı oranları karşılaştırılmıştır. Tüm bu algoritmaların kabul edilebilir başarımları olmasına rağmen, uygulama sonuçlarından yerine koyarak örnekleme sınıflandırma algoritmasının daha yüksek başarı oranına (% 92,90) sahip olduğu görülmüştür. Yapılan çalışmada elde edilen sonuçlar önerilen analiz sisteminin hepatit hastalığı için tanı koymada tıbbi karar destek sistemi olarak kullanılabileceğini göstermiştir.

Özet (Çeviri)

In this thesis, dataset analysis for the diagnosis of whether the patient's hepatitis disease is deadly or not is performed with data mining techniques used in medical decision support systems. The used hepatitis data set was taken from the UCI database (ftp://ftp.ics.uci.edu/pub/machine-learning-databases) which is open for public use. Hepatitis is inflammation of the liver which one of the most important organs of the body. While this inflammation may improve when diagnosed early, it may result in death with persistent damage to the liver at later stages of the disease. There are five types of hepatitis, hepatitis A, B, C, D and E. The data set used in the study consisted of information on a disease description of hepatitis patients, blood values and information related to the ultrasonic examination. This data set contains 19 properties of two classes and a total of 155 samples. Absolute average value preprocessing is applied to the data set for a successful diagnosis to complete the missing data. The decision tree, the nearest neighbors, the naive bayes, the multi-layer artificial neural networks, the bagging and the random subspaces algorithms which are data mining classification techniques, have been applied to the completed data. The application of these algorithms to the data set was performed using the WEKA program which one of the data mining applications development programs. The diagnostic success rates of hepatitis disease is deadly or not were compared. Although all these methods have acceptable outcomes, the bagging algorithm was found to have a higher success rate (92.90%) from the implementation results. The results obtained in the study showed that the proposed analysis system can be used as a medical decision support system for diagnosis of hepatitis.

Benzer Tezler

  1. Veri madenciliğinde sınıflandırma ve kümeleme algoritmaları ile COVID-19 şüphesi taşıyan hastaların değerlendirilmesi

    Evaluation of patients with suspected of covid-19 using classification and clustering algorithms in data mining

    BEYZA DURMAZ

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    Endüstri ve Endüstri MühendisliğiOndokuz Mayıs Üniversitesi

    Akıllı Sistemler Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ASLI ÇALIŞ BOYACI

  2. Veri madenciliğinde sınıflandırma problemleri için optimizasyon yaklaşımları

    Optimization approaches for classification problems in data mining

    ENVER ENGÜR

    Doktora

    Türkçe

    Türkçe

    2024

    Endüstri ve Endüstri MühendisliğiErciyes Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    PROF. DR. BANU SOYLU

  3. Gerçek veri setlerinde sınıflandırma yöntemlerinin performanslarının karşılaştırılması

    Comparision of performance of classfication methods in real data sets

    RAMAZAN AYÖZ

    Yüksek Lisans

    Türkçe

    Türkçe

    2021

    İstatistikMuğla Sıtkı Koçman Üniversitesi

    İstatistik Ana Bilim Dalı

    DOÇ. DR. NEVİN GÜLER DİNCER

  4. Sürekli veri setlerinin farklı ayrıklaştırma yöntemleri kullanılarak kural tabanlı sınıflandırma algoritmalarına uyarlanması ve karşılaştırılması

    Adaptation and comparison of continuous data sets to rule-based classification algorithms by using different discretization methods

    SANARYA SAMAL FAROOQ FAROOQ

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSelçuk Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ MURAT SELEK

  5. Türkiye'de mobil veri kullanımının veri madenciliğinde kullanılan algoritmalar ile analizi

    Analysis with algorithms used in data mining of mobile data usage in Turkey

    MUHAMMET ALİ ALTINIŞIK

    Yüksek Lisans

    Türkçe

    Türkçe

    2017

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolMaltepe Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. ERDAL GÜVENOĞLU