Geri Dön

Sağlık alanında büyük veri ve veri madenciliği yöntemlerinin kullanımı

Big data and data mining methodologies in medicine

  1. Tez No: 453878
  2. Yazar: BATUHAN BAKIRARAR
  3. Danışmanlar: PROF. DR. YASEMİN YAVUZ
  4. Tez Türü: Yüksek Lisans
  5. Konular: Biyoistatistik, Biostatistics
  6. Anahtar Kelimeler: Büyük Veri, Veri Madenciliği, Sınıflama, Tahmin, Big Data, Data Mining, Classification, Prediction
  7. Yıl: 2016
  8. Dil: Türkçe
  9. Üniversite: Ankara Üniversitesi
  10. Enstitü: Sağlık Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Biyoistatistik Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 72

Özet

Sağlık Alanında Büyük Veri ve Veri Madenciliği Yöntemlerinin Kullanımı Büyük veri, kuruluşların (kamu kurumları, hastane vs.) yapılandırılmış ve yapılandırılmamış veri setlerini birleştirerek veri madenciliği ve istatistiksel yöntemler kullanıp keşfedilmemiş bilgileri ve öngörülmeyen korelasyonları ortaya çıkarmasıdır. Veri depolama maliyetlerinin düşmesi ve büyük hacimli verilerle uğraşırken iş yükünü birden çok sanal sunucuya dağıtmaya imkan tanıyan NoSQL veritabanlarının, Hadoop ve benzeri veritabanı tasarımlarının ortaya çıkması ile büyük veri akımı daha hızlı yayılmaya başlamıştır. Yeni teknolojilerin gelişmesi üzerine daha az maliyet ile daha hızlı ve değişik türden verilerin analiz edilmesine ve yeni bulguların ortaya çıkmasına imkan sağladığı için kısa sürede tüm dünyada kabul görmüş ve kullanılmaya başlanmıştır. Son zamanlarda özellikle sağlık alanında bilinen klasik yöntemlerle saklanamayan ve analiz edilemeyen video görüntüleri, hekim notları gibi bilgilerin de büyük veri ile analiz edilmesiyle beraber yeni ve faydalı birçok bilginin elde edilmesine olanak sağlamaktadır. Bu çalışma hastaneye diyabet şüphesi ile başvuran 101766 kişiyi içermektedir. Bu modelde yeni ilaç reçete edilme tahmini için ırk, cinsiyet, yaş, hastane yatış şekli, hastanede geçirilen süre, laboratuvar işlem sayısı, işlem sayısı, ilaç tedavi sayısı, tanı sayısı ve tekrar başvuru olmak üzere toplam 10 değişken bulunmaktadır. Mahout ve Scala yardımıyla Random Forest ve Çok Katmanlı Algılayıcı veri madenciliği yöntemleri kullanıldı. Mahout için sırasıyla bu yöntemlerin Doğru Sınıflama Oranları %87.8 ve %84.9 iken Scala'da bu oranlar %84.9 ve %87.0 olarak bulunmuştur.

Özet (Çeviri)

Big Data and Data Mining Methodologies in Medicine Big data is that businesses, states, hospitals and organizations integrate different digital data sets and use information that has remained hidden and surprise correlations through methods of statistics and data mining. With lower data storage costs and the emergence of NoSQL databases, Hadoop and similar database designs allowing the distribution of workload to multiple virtual servers when dealing with high-volume data, the flow of big data has been spreading even faster. Since newly developed technologies allow for analyzing different types of data for lower costs and in a faster way and emergence of new findings, big data has been accepted by all the world in a short notice and started to be used. Recently, especially the analysis of information such as videos, physician notes which cannot be stored and analyzed with classical methods through big data has facilitated obtaining several pieces of new and useful information. This study consists of 101766 individuals who consulted the hospital with the suspicion of new diabetes medication. In this model, there are 10 variables for the prediction of diabetes: race, gender, age, admission type, time in hospital, number of laboratory procedures, number of procedures, number of medications, number of diagnoses and readmitted. With the help of Mahout and Scala, data mining methods of Random Forest and Multilayer Perceptron were used. True classification rates of these methods were found to be %87.8 and %84.9 for Mahout whereas these rates were found to be %84.9 and %87.0 for Scala.

Benzer Tezler

  1. Veri madenciliği ile çocukluk çağındaki akut romatizmal ateşin kalp hastalığına etkilerinin analizi

    Analysis of effects of acute rheumatic fever in childhood on heart disease with data mining

    İLKİM ECEM EMRE

    Yüksek Lisans

    Türkçe

    Türkçe

    2017

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Üniversitesi

    Enformatik Ana Bilim Dalı

    YRD. DOÇ. DR. ÇİĞDEM EROL

    YRD. DOÇ. DR. YALÇIN ÖZKAN

  2. Veri madenciliği ve makine öğrenmesi yaklaşımı ile tiroit kanserinin tanılanması

    Diagnosis of thyroid cancer using data mining and machine learning approach

    MEHMET EMİN ASAN

    Doktora

    Türkçe

    Türkçe

    2024

    Endüstri ve Endüstri MühendisliğiSakarya Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    PROF. DR. HARUN TAŞKIN

  3. Hastane bilgi yönetim sistem verilerine veri madenciliği ile işlerlik kazandırılması için bir adım : K-ortalama algoritmasında uygun parametre seçimi

    A step towards the functionality of hospital information managment system data using data mining techniqees : Selection of appropriate parameters for K- means

    MERYEM YILDIZLI

    Doktora

    Türkçe

    Türkçe

    2018

    BiyoistatistikÇukurova Üniversitesi

    Biyoistatistik Ana Bilim Dalı

    PROF. DR. ZELİHA NAZAN ALPARSLAN

  4. Yapay zeka yöntemleri ile uzaktan eğitimdeki sorunların tespiti ve öğrencilerin akademik performanslarının tahmin edilmesi

    Detecting the problems in distance education and predicting the academic performance of students by using artificial intelligence methods

    HALİT IRMAK

    Doktora

    Türkçe

    Türkçe

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Üniversitesi

    Enformatik Ana Bilim Dalı

    DOÇ. DR. ZÜMRÜT ECEVİT SATI

  5. Türkiye'de su hakkı

    The right to water in Turkey

    YILDIZ AKEL ÜNAL

    Doktora

    Türkçe

    Türkçe

    2021

    HukukGalatasaray Üniversitesi

    Kamu Hukuku Ana Bilim Dalı

    PROF. DR. ERDOĞAN BÜLBÜL