Veri madenciliği yöntemleri ile ankilozan spondilit hastalığında radyografik progresyona etkili faktörlerin analizi
Analysis of factors affecting radiographic progression in ankylosing spondylitis disease by data mining methods
- Tez No: 394520
- Danışmanlar: YRD. DOÇ. DR. ÇİĞDEM EROL, YRD. DOÇ. DR. YALÇIN ÖZKAN
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2015
- Dil: Türkçe
- Üniversite: İstanbul Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Enformatik Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 125
Özet
Bilgi ve iletişim teknolojilerinde yaşanan gelişmeler, birçok alanda olduğu gibi sağlık alanında da mevcut verilerden yeni bilgi keşfinin kapılarını aralamaktadır. Özellikle veri madenciliği teknikleri, tıbbi verilerin analizinde sağlık çalışanlarına yeni bir ışık tutmaktadır. Bu nedenle son yıllarda sağlık alanında, özellikle hastalıklarla ilgili verilerin analizinde bu teknikler sıklıkla kullanılmaya başlanmıştır. Romatizmal bir hastalık olan ve bireye göre hastalığın seyrinin çeşitlilik gösterdiği Ankilozan spondilit hastalığına ait veri setleri de bu tekniklerin aydınlatmasına ihtiyaç duymaktadır. Bu tez çalışmasında veri madenciliği sınıflandırma algoritmaları kullanılarak, Ankilozan spondilit hastalığına sahip bireylere ait veri seti ile hastalığın radyografik progresyonuna etki eden faktörlerin analiz edilmesi amaçlanmıştır. Çalışmada sınıflandırma karar ağaçları algoritmalarından C4.5, Gini, Regresyon ağaçları ve Random Forest algoritmaları kullanılmıştır. C4.5, Gini, Regresyon ağaçları algoritmaları ile karar ağacı modelleri oluşturulup grafiksel olarak görüntülenmiş, Random Forest algoritması ile tahmin doğruluğu incelemesi yapılmıştır. Yapılan analizler sonucunda en yüksek sınıflandırma ve model doğruluk oranı Gini algoritması sonucu oluşturulan modelde %82 olarak bulunurken, C4.5 algoritmasında 78.7 ve regresyon ağaçlarında %74 olarak bulunmuştur. Ayrıca rasgele orman algoritmasının sınıflandırma başarı tahmini %83.11 olarak bulunmuştur. Cinsiyet, hastalık süresi, servikal tutulum, hastalığın başlangıç yaşı ve IL23rs11209032 (AA veya AG) progresyona etkili faktörler arasında bulunmuştur. Gerçek tıbbi veriler kullanılarak üretilen sonuçlar karar vermede yardımcı model olarak kullanılabilir. Çalışmanın daha ileriye taşınabilmesi için hastalara ait veri girişlerin eksiksiz olarak girilmesi, kayıt sayısının arttırılması gerektiği düşünülmektedir.
Özet (Çeviri)
Developments in information and communication technologies pave the way for discovery of new knowledge from existing data in the health fields as in many areas. Especially data mining techniques lead the way analysis of medical data to health professionals. Therefore, in the health field in recent years, particularly in the analysis of data related to the disease, these techniques have been used frequently. Data sets that has got Ankylosing spondylitis which is a rheumatic disease and progress of the disease vary according to the individual also requires illumination of these. In this thesis using data mining classification algorithms, with individuals who have the disease of Ankylosing spondylitis of the data set is intended to analyze the factors affecting the radiographic progression of the disease. In the study, classification decision tree algorithms which are C4.5 Gini, regression trees and Random Forest algorithm is used. C4.5 Gini, regression trees algorithms imaged decision tree models created graphically and Random Forest algorithm analysis accuracy of the estimate is made. The analysis and model results in the highest classification accuracy rate of 82% in the model were found as a result created the Gini algorithm, C4.5 algorithm was found to be 74% in 78.7 and regression trees. In addition, random forest classification algorithm success has been estimated as 83.11%. Gender, duration of disease, cervical involvement, the age of onset of the disease and IL23rs11209032 (AA or AG) was found among the factors to progression. The results produced by using real medical data can be used as a model helps in decision making. All of the input data to be entered as the patient to be moved further to the study, it is considered necessary to increase the number of records.
Benzer Tezler
- Metin madenciliği teknikleri ile sosyal medya gönderilerinin analiz edilmesi: ankilozan spondilit hastalığı örneği
Analysis of social media posts with text mining techniques the case of ankylosing spondylitis disease
ERTUĞRUL GÜMÜŞSU
Yüksek Lisans
Türkçe
2019
Bilim ve TeknolojiOndokuz Mayıs ÜniversitesiAkıllı Sistemler Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ NACİ MURAT
- Birliktelik kuralı yöntemleri ile e-ticaret satışlarının analizi
Analysis of e-commerce sales with association rule methods
YAVUZ DEMİROK
Yüksek Lisans
Türkçe
2018
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolMaltepe ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ VOLKAN TUNALI
- Veri madenciliği yöntemleri ile sağlık sektörü veritabanlarında bilgi keşfi: Tanımlayıcı ve kestirimci model uygulamaları
Knowledge discovery in health sector databases by using data mining methods: Applications of descriptive and predictive models
SEZGİN IRMAK
- Veri madenciliği yöntemleri ile banka çağrı merkezi müşterilerine uygulanan pazarlama stratejilerinin belirlenmesi
Determining marketing strategies for banking call center customers using data mining methods
TUĞÇE MERVE DEMİR
Yüksek Lisans
Türkçe
2018
BankacılıkBahçeşehir ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. MEHMET ALPER TUNGA
- Veri madenciliği yöntemleri ile banka dijital kanallarına eğilimli müşterilerin belirlenmesi
Determining banking customers with a propensity for digital channels using data mining methods
SEMRA KATILMIŞ
Yüksek Lisans
Türkçe
2018
BankacılıkBahçeşehir ÜniversitesiBilgi Teknolojileri Ana Bilim Dalı
DOÇ. MEHMET ALPER TUNGA