Veri madenciliği yöntemlerini kullanarak anemi sınıflandırılmasına yönelik bir uygulama
Classification of anemia using data mining methods: An application
- Tez No: 389460
- Danışmanlar: YRD. DOÇ. DR. BAŞAR ÖZTAYŞİ
- Tez Türü: Yüksek Lisans
- Konular: Endüstri ve Endüstri Mühendisliği, Mühendislik Bilimleri, Industrial and Industrial Engineering, Engineering Sciences
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2015
- Dil: Türkçe
- Üniversite: İstanbul Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Endüstri Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Mühendislik Yönetimi Bilim Dalı
- Sayfa Sayısı: 107
Özet
Günümüzde gelişen bilgi teknolojileri sayesinde toplanan, saklanan veri miktarı her geçen gün artmaktadır. Veri ve elde edilen bilgi gittikçe önem kazansa da artan veri hacmi insan algısı ile verileri analiz etmeyi imkansız kılmaktadır. Büyük veri tabanlarından istenilen bilgilere klasik sorgulama yöntemleri ile kolayca ulaşılabilse de verilerin barındırdığı gizli bilgilerin öneminin anlaşılması veri madenciliği uygulamalarını gerekli hale getirmektedir. Veri madenciliği, büyük miktarlardaki verinin içinden anlamlı ve yararlı, ilişki ve kuralların bilgisayar programları aracılığıyla analiz edilmesidir. Böylece eldeki verilere uygulanan belirli yöntemlerle mevcut veya geleceğe yönelik anlamlı bilgiler elde edilebilmektedir. Artan veri hacmine rağmen; verilerin toplanması ve saklanmasındaki kolaylık, veri tabanı yönetim sistemlerindeki teknolojik gelişmeler, büyük miktarda ve komplike veri içerisinden gizli kalmış yararlı bilgilerin elde edilebilmesi veri madenciliği uygulamalarına olan ilgiyi arttırmaktadır. Veri madenciliği uygulamaları, verinin bilgiye dönüşümünün öneminin anlaşılması ile telekomünikasyon, bankacılık, sigorta, tıp gibi çeşitli alanlarda yaygın olarak kullanılmaktadır. Tıp alanındaki verinin büyüklüğü ve hayati önem taşıması, veri madenciliğinin bu alanda da uygulanmasını gerekli kılmaktadır. Veri madenciliği yöntemleri tıp alanında kronik hastalıklarda erken uyarı sinyallerinin geliştirilmesi, tıbbi tedavi süreçlerinin optimizasyonu, hasta akış planlarının yapılması gibi birçok farklı amaçla kullanılmaktadır. Bu doğrultuda veri madenciliği yöntemleri ile önceden bilinmeyen, ilk bakışta fark edilemeyen, gizli kalmış anlamlı ve değerli bilgilerin elde edilmesi etkili tedaviyi destekleyici bir unsur oluşturmaktadır. Çalışmamızın amacı veri madenciliği yöntemleri ile anemi hastalıklarının sınıflandırılması üzerine analizler yaparak hastaların anemi tipinin belirlenmesine yardımcı olmaktır. Çalışmamızda Uludağ Üniversitesi Tıp Fakültesi Hematoloji Anabilim Dalı bünyesinde farklı tip anemi hastalarına ve hematolojik açıdan sağlıklı bireylere ait tam kan sayımı testleri incelenerek bir veri seti oluşturulması hedeflenmektedir. Bu veri seti temel alınarak farklı test grupları oluşturulması planlanmaktadır. Test gruplarına veri madenciliği yöntemlerinden Karar Ağaçları, Yapay Sinir Ağları, Bayesyen Sınıflandırma ve K-En Yakın Komşu yöntemleri uygulanarak anemi hastalıklarının sınıflandırılması planlanmaktadır. Bu kapsamda uygulanan dört farklı yöntemde parametre değişikliklerine gidilerek hem yöntem içinde parametreler arası, hem de testlerde yöntemler arası karşılaştırmalar yapılacaktır. Böylece tam kan sayımı testi sonuçlarına veri madenciliği yöntemleri uygulanması ile anemi hastalıklarının sınıflandırılmasında doktorlara yardımcı olacak bir sistem geliştirilmesi planlanmaktadır.
Özet (Çeviri)
Nowadays, as a result of evolving information technology, amount of collected and stored data is increasing day by day. Even if data and information gain importance, increasing volumes of data makes impossible to analyze the data with human perception. Although accessing the desired data in huge databases is easy by classical polling methods, understanding of the importance hidden information in data makes data mining applications necessary. Data mining aims to gain useful knowledge and hidden patterns from large amount of data using computer programs. Data mining converts data into knowledge and useful information. Thus, it is possible to acquire present or prudential meaningful knowledge thanks to data mining applications. This knowledge that gained from data has an important role in decision making process. The demand for data mining applications is increasing due to easiness of collecting and storing data, technological development in database management system, and gaining useful information from huge and complex data. As a result of understanding the importance of the conversion data into knowledge, data mining applications used in various areas such as telecommunication, banking, insurance, medical, and etc. Using data mining applications in medical area is crucial because of the huge amount and vital importance of data. Data mining applications use for various purposes in medical area such as recognizing early symptoms of chronic diseases, optimizing process of medical treatment, planning patient flow. In this respect, gaining valuable hidden information with data mining applications encourages effective treatment. The main purpose of our study is to classify anemia with various data mining applications and compares them to obtain optimal classification method. Our study is aimed to create data set with examining complete blood count tests that belonging to different types of anemia patients and hematological healthy individuals within the scope of Uludağ University Internal Medicine Division of Hematology Department. Different test groups are planned to be created by changing parameters of generated data set. Classification of anemia diseases will be obtained by applying various data mining applications such as Decision Tree, Neural Networks, Bayesian classification and K-nearest Neighbor. In this context, comparisons between methods in test groups as well as parameters in methods will be attained by changing parameters in four different methods applied in our research. In this way, developing a system which assisting the physicians about classifying anemia disease is planned by applying data mining methods to complete blood test results.
Benzer Tezler
- Makine öğrenmesi sınıflandırma yöntemleri ilehematoloji hastalıklarından demir eksikliği anemisininerken teşhis edilmesi
Iron deficiency anemia from hematological diseases with machine learning classification methodsearly diagnosis
BÜNYAMİN SARIBACAK
- Veri madenciliği yöntemlerini kullanarak diyabetik retinopati hastalığının teşhisi
Diagnosis of diabetic retinopathy using data mining techniques
MENDUH ÇERKEZİ
Yüksek Lisans
Türkçe
2013
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSakarya ÜniversitesiBilgisayar ve Bilişim Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. HAYRETTİN EVİRGEN
- Gerçek tıbbi veriler üzerinde veri madenciliği yöntemlerini kullanarak hastalık teşhisi
Diagnosis of disease by using data mining methods on real medical data
HATİCE ÇATALOLUK
Yüksek Lisans
Türkçe
2012
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBilecik Şeyh Edebali ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. METİN KESLER
- Birliktelik analizi ve bir uygulaması
Association analysis and an application
ONUR BAYRAM
Yüksek Lisans
Türkçe
2014
İstatistikMimar Sinan Güzel Sanatlar Üniversitesiİstatistik Ana Bilim Dalı
PROF. DR. GÜLAY BAŞARIR
- Veri madenciliği yöntemleriyle depremlerin analizi
Analysis of earthquakes by means of data mining methods
ÖZAL YILDIRIM
Yüksek Lisans
Türkçe
2010
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolFırat ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. GALİP AYDIN