Veri madenciliğinde sınıflandırma algoritmaları kullanılarak hepatit hastalığının tespiti
Detection of hepatitis disease using classification algorithms in data mining
- Tez No: 507111
- Danışmanlar: DOÇ. DR. AHMET ALKAN
- Tez Türü: Yüksek Lisans
- Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2018
- Dil: Türkçe
- Üniversite: Kahramanmaraş Sütçü İmam Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 84
Özet
Bu tez çalışmasında, tıbbi karar destek sistemlerinde kullanılan veri madenciliği teknikleri ile hastanın hepatit hastalığının ölümcül olup olmadığının teşhisi için veri seti analizi gerçekleştirilmiştir. Çalışmada kullanılan hepatit veri seti, genel erişime açık olan UCI veri tabanından (ftp://ftp.ics.uci.edu/pub/machine-learning-databases) alınmıştır. Hepatit, vücudumuzun en önemli organlarından birisi olan karaciğerin iltihaplanmasıdır. Bu iltihaplanma erken teşhis edilmesi durumunda iyileşme gösterebilirken, hastalığın ileriki safhalarında karaciğerde kalıcı hasara neden olmakla birlikte ölümle de sonuçlanabilir. Hepatitin A, B, C, D ve E olmak üzere beş tipi bulunmaktadır. Çalışmada kullanılan veri seti hepatit hastalarına ait birtakım hastalık belirtileri bilgileri, kandaki değerler ve ultrasonik tetkikle ilgili bilgilerden oluşmaktadır. Bu veri seti iki sınıfa ait 19 özellik ve toplam 155 adet örnek içermektedir. Başarılı bir tanı için veri setine ortalama değer ön işlemi uygulanarak eksik olan verilerin tamamlanması sağlanmıştır. Tamamlanmış verilere veri madenciliği sınıflandırma tekniklerinden olan karar ağacı, k en yakın komşu (K-NN) , naive bayes, çok katmanlı yapay sinir ağları, yerine koyarak örnekleme (bagging) ve rastgele altuzaylar (random subspaces) algoritmaları uygulanmıştır. Bu algoritmaların veri setine uygulanması veri madenciliği uygulamaları geliştirme programlarından WEKA programı kullanılarak gerçekleştirilmiştir. Uygulanan sınıflandırma yöntemlerinin hepatit hastalığının ölümcül olup olmadığına ilişkin teşhis başarı oranları karşılaştırılmıştır. Tüm bu algoritmaların kabul edilebilir başarımları olmasına rağmen, uygulama sonuçlarından yerine koyarak örnekleme sınıflandırma algoritmasının daha yüksek başarı oranına (% 92,90) sahip olduğu görülmüştür. Yapılan çalışmada elde edilen sonuçlar önerilen analiz sisteminin hepatit hastalığı için tanı koymada tıbbi karar destek sistemi olarak kullanılabileceğini göstermiştir.
Özet (Çeviri)
In this thesis, dataset analysis for the diagnosis of whether the patient's hepatitis disease is deadly or not is performed with data mining techniques used in medical decision support systems. The used hepatitis data set was taken from the UCI database (ftp://ftp.ics.uci.edu/pub/machine-learning-databases) which is open for public use. Hepatitis is inflammation of the liver which one of the most important organs of the body. While this inflammation may improve when diagnosed early, it may result in death with persistent damage to the liver at later stages of the disease. There are five types of hepatitis, hepatitis A, B, C, D and E. The data set used in the study consisted of information on a disease description of hepatitis patients, blood values and information related to the ultrasonic examination. This data set contains 19 properties of two classes and a total of 155 samples. Absolute average value preprocessing is applied to the data set for a successful diagnosis to complete the missing data. The decision tree, the nearest neighbors, the naive bayes, the multi-layer artificial neural networks, the bagging and the random subspaces algorithms which are data mining classification techniques, have been applied to the completed data. The application of these algorithms to the data set was performed using the WEKA program which one of the data mining applications development programs. The diagnostic success rates of hepatitis disease is deadly or not were compared. Although all these methods have acceptable outcomes, the bagging algorithm was found to have a higher success rate (92.90%) from the implementation results. The results obtained in the study showed that the proposed analysis system can be used as a medical decision support system for diagnosis of hepatitis.
Benzer Tezler
- Veri madenciliğinde sınıflandırma ve kümeleme algoritmaları ile COVID-19 şüphesi taşıyan hastaların değerlendirilmesi
Evaluation of patients with suspected of covid-19 using classification and clustering algorithms in data mining
BEYZA DURMAZ
Yüksek Lisans
Türkçe
2024
Endüstri ve Endüstri MühendisliğiOndokuz Mayıs ÜniversitesiAkıllı Sistemler Mühendisliği Ana Bilim Dalı
DOÇ. DR. ASLI ÇALIŞ BOYACI
- Veri madenciliğinde sınıflandırma problemleri için optimizasyon yaklaşımları
Optimization approaches for classification problems in data mining
ENVER ENGÜR
Doktora
Türkçe
2024
Endüstri ve Endüstri MühendisliğiErciyes ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
PROF. DR. BANU SOYLU
- Gerçek veri setlerinde sınıflandırma yöntemlerinin performanslarının karşılaştırılması
Comparision of performance of classfication methods in real data sets
RAMAZAN AYÖZ
Yüksek Lisans
Türkçe
2021
İstatistikMuğla Sıtkı Koçman Üniversitesiİstatistik Ana Bilim Dalı
DOÇ. DR. NEVİN GÜLER DİNCER
- Sürekli veri setlerinin farklı ayrıklaştırma yöntemleri kullanılarak kural tabanlı sınıflandırma algoritmalarına uyarlanması ve karşılaştırılması
Adaptation and comparison of continuous data sets to rule-based classification algorithms by using different discretization methods
SANARYA SAMAL FAROOQ FAROOQ
Yüksek Lisans
Türkçe
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSelçuk ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ MURAT SELEK
- Türkiye'de mobil veri kullanımının veri madenciliğinde kullanılan algoritmalar ile analizi
Analysis with algorithms used in data mining of mobile data usage in Turkey
MUHAMMET ALİ ALTINIŞIK
Yüksek Lisans
Türkçe
2017
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolMaltepe ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. ERDAL GÜVENOĞLU