Tıbbi karar destek sisteminin veri madenciliği yöntemleriyle gerçekleştirilmesi
Verifying medical decision support system with the methods of data mining
- Tez No: 330756
- Danışmanlar: PROF. DR. A. YILMAZ ÇAMURCU
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2013
- Dil: Türkçe
- Üniversite: Marmara Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Elektronik-Bilgisayar Eğitimi Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 86
Özet
Tıp alanında teşhis ve tedavi kayıtlarının bilgisayar programları tarafından analiz edilmesi etkili tedaviyi destekleyici bir unsur oluşturmaktadır. Birçok alanda olduğu gibi, tıp alanında da veri madenciliği yöntemlerinin kullanımı hızla artmaktadır. Veri madenciliği yöntemlerinin kullanıldığı tıbbi karar destek sistemi tasarımı gerçekleştirerek tıbbi veri setlerinden elde edilecek sonuç ile hekimlere destekleyici yardımda bulunacak sistemin geliştirilmesi bu tezin başlıca amacıdır.Geliştirilen sistemde iki ayrı veri setinde çalışma yapılmıştır. Birinci veri setinden metastatik kolorektal kanser hastalığının hayatta kalma durumu ve ikinci veri setinden ise diyabet hastalığı veri madenciliği yöntemleri kullanılarak tahmin edilmiştir.Çalışmada, sınıflandırma tahmin modeli ve hibrid tahmin modeli olmak üzere iki ayrı tıbbi karar destek sistemi modeli geliştirilmiş ve iki ayrı modelden alınan sonuçlar incelenerek karşılaştırılmıştır. Veri madenciliği sürecindeki veri ön işleme aşamasından sonra, verilerin sınıflandırılması aşamasında, Destek Vektör Makineleri, Naive Bayes, Karar Ağaçları, Yapay Sinir Ağları, Çok Katmanlı Algılayıcı, Lojistik Regresyon algoritmaları kullanılmıştırMetastatik kolorektal kanser veri setinde, yalnızca sınıflandırma algoritmalarının uygulandığı sınıflandırma tahmin modelinde, en başarılı algoritma Destek Vektör Makineleri iken Hibrid tahmin modelinde, karar ağaçları ve yapay sinir ağları %100 doğruluk oranı ile en başarılı algoritmalar olmuşlardır. Sınıflandırma işlemleri sonucunda modellerin doğruluk değerlerine bakıldığında, Sınıflandırma tahmin modelinin doğruluk oranı %65-70 iken Hibrid tahmin modelinde bu oranın %95-100'lere ulaştığı görülmektedir. Gerçekleştirilen hibrid yapı ile yani kümeleme ile sınıflandırma algoritmalarının birleştirerek uygulanmasında doğruluk oranlarının tüm algoritmalar için çok yüksek ve birbirine çok yakın değerler çıkardığı görülmüştür.Diyabet hastalığı analizinde, önişlemden geçirilen diyabet verileri K-means kümeleme algoritmasıyla kümelenmiş ve kümeleme sonucu sınıfları yanlış tahmin edilen veriler veri setinden silinmiştir. Yeni veri seti üzerinde seçilen veri madenciliği sınıflandırma algoritmaları denenmiş ve algoritma başarımlarının değerlendirilmesi, Weka ve RapidMiner veri madenciliği programlarıyla gerçekleştirilmiştir. İki programın da tüm algoritmalar için çok yüksek başarı oranlarına sahip olduğu görülmüştür. Karşılaştırma algoritmalar açısından yapıldığında Çok Katmanlı Algılayıcı algoritması iki programda da en yüksek başarı yüzdesi ile en iyi algoritma, karar ağaçları algoritması ise iki program için de başarı yüzdesi en düşük algoritma olmuştur.Bulgularımız geliştirilen sistemin kullanılmasının, hekimlere karar verme aşamasında yardımcı olacağını göstermektedir.
Özet (Çeviri)
The analysis of the diagnosis and the treatment records in the field of Medicine by computer programs forms a supportive element in efficient treatment. As in many fields, the use of the methods of data mining has been increasing rapidly in Medicine. Developing the system which can help the doctors is the main purpose of this thesis with designing the medical decision support system and getting the results from medical data sets.In the developed system, studies have been carried out in two different data sets. In the first data set, survival of metastatic colorectale cancer disease, and in the second data set, survival of the disease of diabetes have been estimated with the application of data mining.In the study, two medical decision support systems; classification prediction model and hybrid prediction model have been developed, and the results from both models have been compared by analysing. In the process of data mining, after the stage of pre-processing of data, in the stage of classifying the data, Support Vector Machine, Naive Bayes, Decision Trees, Artificial Neural Networks, Multilayer Perceptron and Logistic Regression algorithms have been applied.In the prediction model in which only classification algorithms have been used, in the data set of metastatic colorectale cancer, the most successful algorithm has been Support Vector Machine, but in Hybrid Prediction Model, decision trees and artificial neural networks have been the most successful algorithms with the rate of a hundred percent accuracy. When the accuracy rate of the models are examined at the end of the classifying process, the accuracy rate of classification prediction model has been %65-70, the accuracy rate of hybrid prediction model has reached %95-100. It has been observed that the accuracy rates are very high and very close to each other for all algorithms in the applicaiton of combining hybrid structure, which can be called clustering with classification algorithms.In the analysis of diabetes disease, the diabetes datas, which were processed pre- processing, have been clustered with the K-means clustering algorithm and at the end of the clustering, the datas whose classes have been estimated wrongly have been erased from the data set. Data mining classifying algorithms have been experimented on a new data set and the evaluation of the success of the algorithms has been made with Weka and RapidMiner data mining programs. Two programs have been observed to have very high success rates for all algorithms. When the comparison made in terms of algoritms, Multilayer Perceptron algorithm is the best algorithm with the highest success rate in both programs and decision trees has the lowest success rate for both programs.Our findings indicates that the usage of the developed system can help the doctors in the decision making process.
Benzer Tezler
- Pulmoner emboli klinik tanı sistemi
Pulmonary embolism clinical support system
ÖZLEM KARADENİZ
Yüksek Lisans
Türkçe
2018
BiyoistatistikKaradeniz Teknik ÜniversitesiBiyoistatistik ve Tıbbi Bilişim Ana Bilim Dalı
YRD. DOÇ. DR. BURÇİN KURT
- Analitik hiyerarşi süreci ve veri madenciliği teknikleriyle hibrit bir karar destek sistemi uygulaması: kovid19 tanısı
A hybrid decision support system application with analytic hierarchy process and data mining techniques: diagnosis of COVİD 19
AHMET BURSALI
Yüksek Lisans
Türkçe
2023
BiyoistatistikEge ÜniversitesiBiyoistatistik ve Tıbbi Bilişim Ana Bilim Dalı
DOÇ. DR. ASLI SUNER KARAKÜLAH
- Veri madenciliğinde sınıflandırma algoritmaları kullanılarak hepatit hastalığının tespiti
Detection of hepatitis disease using classification algorithms in data mining
SEMA GÜZEL
Yüksek Lisans
Türkçe
2018
Elektrik ve Elektronik MühendisliğiKahramanmaraş Sütçü İmam ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
DOÇ. DR. AHMET ALKAN
- Implementation of some medical data in Apriori algorithm
Apriori algoritmasının bazı tıbbı verilere uygulanması
FAWAD SADIQMAL
Yüksek Lisans
İngilizce
2015
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSakarya ÜniversitesiBilgisayar ve Bilişim Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. NILÜFER YURTAY
- Veri madenciliği kullanarak biyokimya verilerinden hastalık teşhisi
An analyse of a deseases with biochemical data by using data mining
ŞENGÜL DOĞAN
Yüksek Lisans
Türkçe
2007
BiyomühendislikFırat ÜniversitesiBiyomühendislik Ana Bilim Dalı
Y.DOÇ.DR. İBRAHİM TÜRKOĞLU