Geri Dön

Diagnoses of coronary heart disease (CHD) using data mining techniques based on classification

Sınıflandırma temelli veri madenciliği teknikleri kullanılarak koroner kalp hastalığı (KKH) tanısı

  1. Tez No: 520268
  2. Yazar: MUSTAFA ADIL FAYEZ FAYEZ
  3. Danışmanlar: YRD. DOÇ. DR. OĞUZ ATA
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: KKH, Sınıflandırma teknikleri, Python, Veri madenciliği
  7. Yıl: 2018
  8. Dil: İngilizce
  9. Üniversite: Altınbaş Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilişim Teknolojileri Ana Bilim Dalı
  12. Bilim Dalı: Bilişim Teknolojileri Bilim Dalı
  13. Sayfa Sayısı: 82

Özet

dünyada çok fazla ilgiyi çekmiştir. Bu günlerde, veri madenciliği özellikle ticari ve medikal alanda olmak üzere birçok alanda kullanılmaktadır. Özellikle medikal alan, veri üretiminin sürekli olması ve farklı öznitelik çıkarımı yöntemlerinin bulunmasından dolayı hastalığın yayılmasına dair çözümler önermektedir. Veri madenciliği sınıflandırma teknikleri ve bir programlama dili kullanarak süreç için gereken maliyet ve zamanın daha iyi azaltılması için KKH teşhisine yardımcı olacak bir sistem tasarladık. Bu algoritmalar iyi sonuçlar ve yüksek doğruluk elde etmiştir. Çalışmamızı çeşitli KKH veri kümelerine uyguladık. Hungarian iki sınıflı verisetinde Rastgele Orman(Random Forest - RF) algoritması kullanılarak en iyi doğruluğu % 99 oranında elde ettik. Cleveland veri seti ile, aynı algoritmayı kullanarak % 94 oranında doğruluk elde ettik, kıyasladığımız bir başka çalışmadaki sonuçta aynı veri kümesinde elde ettikleri doğruluk oranı SVM algoritması ile % 58 idi. Ayrıca, Hungarian beş sınıflı veri kümesi ile kıyasladığımız önceki çalışmada SVM algoritması kullanılarak % 67 doğruluk oranı elde edilmişken biz Rastgele Orman(RF) algoritması ile %99 doğruluk oranı elde ettik. Buna ek olarak, AdaBoast algoritması ile Hungarian veri setinde %88 ve heart.csv veri setinde Logistic Regression algoritması ile %87 doğruluk oranı elde ettik. Ayrıca Switzerland veri seti ile Rastgele Orman(RF) algoritması kullanarak %95 ve Long-Beach veri seti ile aynı algoritmadan %91 doğruluk oranı elde ettik. Son olarak, Switzerland veri seti ile AdaBoost ve Logistic Regression algoritmaları ile %78, Long-Beach veri setinde AdaBoost algoritması ile %80, Logistic Regression algoritması ile %76, heart.csv veri setinde Logistic Regression ile %87 ve AdaBoost algoritması ile %86 doğruluk oranı elde ettik. xiv Bu çalışmada KKH için farklı veri setleri için ortak önişlem ve eğitim-test veri bölmesi kullandık. Bu işlem önceki çalışmadan önemli ölçüde farklıdır ve aynı KKH veri setleri ile elde edilen sonuçlardan daha başarılı sonuçlar almamıza katkıda bulunmuştur.

Özet (Çeviri)

Coronary heart disease (CHD) has attracted the most attention around the world because it leads to death. These days, data mining in many fields, including commercial fields and medical fields, where medical fields are the most productive of large data on a continuous basis, and which must find different ways to extract information, may be important in predicting the spread of this disease. We have designed a system to help the diagnosis of CHD with better reduction of costs and time required for the process by using a programing language with data mining classification techniques. These algorithms produced good results and high accuracy. We applied our study to various CHD datasets. We obtained the best accuracy at 99% through the use of the Random Forest (RF) algorithm with Hungarian two classes. With Cleveland, we obtained 94% accuracy using the same algorithm while the better accuracy with the same dataset in the previous study was 58% when using the SVM algorithm. Moreover, with the Hungarian five class dataset, we obtained 99% as the best accuracy using random Forest Classifier algorithm rather than the accuracy that was achieved with this dataset in previous work, which was close to 67% using the SVM algorithm. In addition, we obtained 88% as a better accuracy using the AdaBoost classifier with the Hungarian data set and 87% accuracy using the Logistic Regression classifier with the heart.csv dataset. With the Switzerland dataset, we had 95% as the best accuracy using Random Forest and 91% best accuracy with the Long-Beach dataset using the same classifier. Finally, with the Switzerland dataset, we achieved a 78% better accuracy using the AdaBoost and Logistic Regression classifier. With Long-Beach, we had 80% using the AdaBoost classifier and 76% xii using the Logistic Regression classifier. Also with the heart.csv dataset, we achieved 87% best accuracy using the Logistic Regression classifier and 86% accuracy when using the AdaBoost classifier. We used a train test split and preprocessing for the CHD dataset in this study and processed the missing values that were found with attributes with a less complicated system. This process differs significantly from previous study is proposed results and accuracy for this purpose with the same CHD dataset.

Benzer Tezler

  1. Göğüs ağrısı şikayeti ile acil servise başvuran hastalarda akut koroner sendrom riskinin belirlenmesinde HEARTS3 skorunun kullanılabilirliği

    Determination of acute coronary syndrome risk applicability of HEARTS3 score in patients with chest pain presenting to the emergency department

    HASAN KARABULUT

    Tıpta Uzmanlık

    Türkçe

    Türkçe

    2014

    KardiyolojiGazi Üniversitesi

    Dahili Tıp Bilimleri Bölümü

    DOÇ. DR. AYFER KELEŞ

  2. A novel intelligent machine learning system for coronary heart disease diagnosis

    Başlık çevirisi yok

    HAEDAR ALSAFI

    Doktora

    İngilizce

    İngilizce

    2022

    Elektrik ve Elektronik MühendisliğiAltınbaş Üniversitesi

    Elektrik ve Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. OSMAN NURİ UÇAN

  3. 11-17 yaş grubu okul çağı çocuklarda koroner kalp hastalığı risk faktörlerinin belirlenmesi

    Determination of risk factors for coronary heart disease in school children aged 11 to 17 yaers

    ESMA DEMİREZEN

    Yüksek Lisans

    Türkçe

    Türkçe

    1999

    Halk Sağlığıİstanbul Üniversitesi

    Halk Sağlığı Hemşireliği Ana Bilim Dalı

    DOÇ. DR. SEMRA ERDOĞAN

  4. Koroner arter hastalarında yaşam kalitesi ve etkileyen faktörler

    Factors affecting quality of life(qol) in patients with coronary artery disease

    HACER YILDOĞAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2012

    Halk SağlığıErciyes Üniversitesi

    Halk Sağlığı Ana Bilim Dalı

    PROF. DR. MUALLA AYKUT

  5. Kalp-damar hastalarında a tipi davranış ve öfke analizi

    Analysis of A type behavior pattern and anger profiles in patients with coronary heart disease

    ALİ GÜHER ENİSELER

    Yüksek Lisans

    Türkçe

    Türkçe

    2007

    BiyolojiCelal Bayar Üniversitesi

    Biyoloji Ana Bilim Dalı

    Y.DOÇ.DR. SELİM UZUNOĞLU