Tıp 'da veri madenciliği uygulamaları: Meme kanseri veri seti analizi
Data mining aplications in medicine :Breast cancer data set analysis
- Tez No: 318330
- Danışmanlar: DOÇ. DR. ERDEM UÇAR
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Biyoistatistik, Computer Engineering and Computer Science and Control, Biostatistics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2012
- Dil: Türkçe
- Üniversite: Trakya Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 121
Özet
Veri madenciliği, günümüz bilgi çağında en güncel makine öğrenmesi yöntemlerden birisidir. Bilgisayar sistemlerinin her geçen gün hem daha ucuzluyor olması, hem de güç ve kapasitelerinin artıyor olması, bilgisayarlarda daha büyük miktarlarda verinin saklanabilmesine imkan vermektedir.Veri madenciliği, dünya üzerinde artan veri miktarının etkili bir biçimde kullanılmasının neredeyse tek çözümü olarak görülmektedir. Bu yüzden, büyük miktardaki verileri isleyebilen teknikleri kullanabilmek, günümüzde büyük önem kazanmaktadır. Veri madenciliği bu gibi durumlarda kullanılan, büyük miktardaki veri setlerinde saklı durumda bulunan örüntü ve eğilimleri keşfetme işlemidir.Veri ambarlarında toplanan veriler tek başlarına değersizdirler. Bu veriler ancak belli bir amaç doğrultusunda işlendiği zaman anlamlı hale gelmektedir. Veriyi amacına uygun bilgiye dönüştürme isi veri madenciliği ile yapılabilmektedir.Akıllı veri işleme metodu olan veri madenciliği, dünya üzerinde artan veri miktarının etkili bir biçimde kullanılmasının neredeyse tek çözümü olarak görünmektedir. Bu gelişme diğer alanlarda olduğu gibi tıp alanında da ilgi odağı haline gelmiştir. Özellikle tıp alanındaki verinin büyüklüğü ve hayati önem taşıması bu alandaki uygulamaları daha da önemli kılmaktadır.Bu tezde sağlık verilerinden veri madenciliği uygulaması üzerine hazırlanmıştır. Veri madenciliğin tanımı ve veri madenciliği teknikleri ile kanser çeşitlerinden biri olan ve bayanlar arasında en sık görülen Meme Kanseri hakkında kısa bilgi verildikten meme kanseri üzerine weka'da yapılan uygulama anlatılacaktır.Uygulamada Wisconsin veri seti kaynağından meme kanseri verileri üzerinden bir karar ağacı algoritması olan ve temeli ID3 ve C4.5 algoritmalarına dayanan J48, Bayes sınıflandırma algoritmalarından Naive-Bayes, regresyon tabanlı algoritmalardan lojistik regresyon ve örnek tabanlı sınıflandırma algoritmalarından Kstar algoritmaları kullanılarak modeller oluşturulmuş ve oluşturulan modellerin başarım dereceleri karşılaştırılmıştır.
Özet (Çeviri)
Data mining, machine learning methods in today's information age is one of the most up to date. Day by day computer systems are being cheaper and also their capacities are increasing, so it enables computers to store more data.Data mining is seen as a unique solution in all over the world for using data capacity in an efficient way. Therefore using techniques that can process huge data gain more importance today. Data mining is exploring hidden patterns and trends that are use in these kinds of data sets.Data that are collected in data warehouse solitarily is invaluable. These can be valuable if they will be processed for an aim. Replacing data into information can be performed by data mining.Data mining having smart data process methods is seen as a unique solution in all over the world for using data capacity in an efficient way. These developments become the center of attention in all other areas but also in medicine. Especially the size of the data in medicine area and the content of the data make applications in this area more important.This thesis is prepared upon data mining based on health data. After giving a short brief on breast cancer, which is seen most frequent between females and which is one of the types of cancer, the application that is performed on ?weka? will be described.These application models are constituted by using J48, which is based on ID3 and C4.5 and which is a decision tree algorithm on breast cancer, Naïve-Bayes algorithm, which is one of the classification algorithms of Bayes, Logistic regression, which is based on regression and sample based Kstar algoritms and the success degrees of these methods are compared.
Benzer Tezler
- Obtain anterior/posterior position of the tumor through machine learning
Makine öğrenme yoluyla tümörün anterior/posterior pozisyonunu elde edin
GOLSHAN GHOLAMPOUR
Yüksek Lisans
İngilizce
2023
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiElektronik-Haberleşme Eğitimi Ana Bilim Dalı
PROF. DR. İBRAHİM AKDUMAN
- Veri madenciliği yöntemlerini kullanarak anemi sınıflandırılmasına yönelik bir uygulama
Classification of anemia using data mining methods: An application
BETÜL MERVE FAKI
Yüksek Lisans
Türkçe
2015
Endüstri ve Endüstri Mühendisliğiİstanbul Teknik ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. BAŞAR ÖZTAYŞİ
- Tıp'ta veri madenciliği uygulamaları: Yenidoğan sepsisi veri seti analizi
Data mining applications in medicine: Newborn sepsis data set analysis
AYTAÇ TEKİN
Yüksek Lisans
Türkçe
2018
Bilim ve TeknolojiFırat ÜniversitesiTeknoloji ve Bilgi Yönetimi Ana Bilim Dalı
DR. ÖĞR. ÜYESİ MUSTAFA ULAŞ
- Tıp bilişimi ve veri madenciliği uygulamaları: EEG sinyallerindeki epileptiform aktiviteye veri madenciliği yöntemlerinin uygulanması
Medical informatics and data mining applications: Application of data mining methods into epileptiform activity in EEG signals
ÜMİT CAN KUMDERELİ
Yüksek Lisans
Türkçe
2012
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolTrakya ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. ERDEM UÇAR
- Veri madenciliği uygulamaları için yeni bir arayüz tasarımı
A new interface design for data mining applications
YUSUF ÇELİK
Yüksek Lisans
Türkçe
2016
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolFırat ÜniversitesiYazılım Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. MURAT KARABATAK