Geri Dön

Sağlık bilimlerinde veri ön işleme

Data preprocessing in health sciences

  1. Tez No: 781243
  2. Yazar: SEDA TAŞ
  3. Danışmanlar: PROF. DR. SEVİNÇ GÜLSEÇEN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2023
  8. Dil: Türkçe
  9. Üniversite: İstanbul Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Enformatik Ana Bilim Dalı
  12. Bilim Dalı: Enformatik Bilim Dalı
  13. Sayfa Sayısı: 82

Özet

Günümüzde her alanda olduğu gibi sağlık alanında da veri madenciliği, istatistik, makine öğrenmesi gibi çalışmalar yapılmaktadır. Her an gelişerek devam eden bu çalışmalar sağlık alanda sıklıkla kullanılmakta ve çeşitli faydalar sağlamaktadır. Fakat her ne kadar faydalı olsa da yanlış uygulamalar yapılması durumunda insan hayatını etkileyebilecek olumsuz etkileri de bulunmaktadır. Bu sebeple veri madenciliği, istatistik veya makine öğrenmesi çalışmalarının hayati önem taşıyan sağlık alanında dikkatli şekilde yapılması gerektirmektedir. Sağlık verisi genellikle eksik değer içeren, gürültülü ve dengesiz verilerdir. Veri madenciliği, istatistik veya makine öğrenmesi çalışması ile doğruluk oranı ve güvenilirliği yüksek sonuca ulaşabilmek için kullanılacak olan verinin ilgili çalışmaya uygun hale getirilmesi gerekmektedir. Bu sebeple verinin veri ön işleme sürecinden geçirilmesi önem arz etmektedir. Bu tez çalışmasında veri ön işleme yöntemlerine odaklanılmış ve bir veri seti kullanılarak sağlık alanında veri ön işleme yöntemlerinin kullanımına yönelik örnek olması için bir uygulama gerçekleştirilmiştir. Tez kapsamında kullanılan veri seti Meme Sağlığı Derneği (MEMEDER)'nden anonim olarak temin edilmiş, 8825 satır ve 5567 sütundan oluşan retrospektif bir veri setidir. Veri seti ile çalışma yapılabilmesi yapılan başvuru 24/06/2022 tarihli ve 12 sayılı etik kurulda görüşülmüş, 2022/896 dosya numarası ile etik kurul tarafından onay alınmıştır. Veri seti incelenmiş ve veri temizleme, veri indirgeme ve veri dönüştürme ön işlemleri veri setine uygulanmıştır. Uygulaması yapılan veri ön işleme yöntemleri, veri seti ile kümeleme çalışması yapılacağı düşünülerek seçilmiştir. Bu uygulama sonucunda 8825 satır ve 50 sütundan oluşan bir veri seti elde edilmiştir. Yapılan bu uygulamalar ile veri seti eksik ve aykırı değer içermeyen, daha küçük boyutlu veri madenciliği, istatistik ve makine öğrenmesi çalışmalarına uygun bir veri seti haline getirilmiştir. Gelecek çalışmalarda veri ön işleme yöntemleri birden fazla sağlık verisi kullanılarak farklı veri setleri üzerindeki uygulamalarına örnekler verilebilir ve farklı veri setleri üzerindeki performansı karşılaştırılarak her veri seti için en iyi alternatifi bulmak üzerine çalışmalar geliştirilebilir.

Özet (Çeviri)

Nowadays, studies such as data mining, statistics and machine learning are carried out in the field of health as in every field. These studies, which continue to develop at every moment, are frequently used in the field of health and provide various benefits. However, although it is beneficial, it also has negative effects that can affect human life in case of wrong implementation. Therefore, data mining, statistics or machine learning studies need to be done carefully in the field of health, which is of vital importance. Health data is generally incomplete, noisy and unstable data. In order to achieve high accuracy and reliability results with data mining, statistics or machine learning study, the data to be used should be made suitable for the relevant study. Therefore, it is important to pass the data through the data preprocessing process. In this thesis focuses on data preprocessing methods and an implementation was carried out to set an example for the use of data preprocessing methods in the field of health by using a data set. The data set used in the thesis is a restrospective data set consisting of 8825 rows and 5567 columns, obtained anonymously from the Breast Health Association (MEMEDER). The application to be able to work with the data set was discussed at the ethics committee dated 24/06/2022 and numbered 12, and approval was received by the ethics committee with the file number 2022/896. The data set was examined and data cleaning, data reduction and data transformation preprocesses were applied to the data set. The implemented data preprocessing methods have been chosen considering that clustering study will be done with the data set. As a result of this implementation, a data set consisting of 8825 rows and 50 columns was obtained. With these implementations, the data set is made into a smaller size data set that does not contain missing or outliers and was prepared for data mining, statistics and machine learning studies. In future studies, examples of applications of data preprocessing methods on different datasets can be given by using more than one health data and studies can be developed to find the best alternative for each dataset.

Benzer Tezler

  1. Kişisel verilerin korunması hukuku bağlamında sağlık bilimlerinde yapay zeka kullanımı

    Use of artificial intelligence in health sciences in the context of personal data protection law

    ELİF ILGIN ÖZCAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    HukukAkdeniz Üniversitesi

    Sağlık Hukuku Ana Bilim Dalı

    DOÇ. DR. SELİN SERT SÜTÇÜ

  2. Mathematical model-based clinical decision support system algorithm design study that can support the diagnosis of celiac disease

    Çölyak hastalığının teşhisine destek verebilecek matematik model tabanlı kds algoritması tasarımı

    ELİF KESKİN BİLGİÇ

    Doktora

    İngilizce

    İngilizce

    2024

    Mühendislik Bilimleriİstanbul Üniversitesi-Cerrahpaşa

    Biyomedikal Mühendisliği Ana Bilim Dalı

    DR. İNCİ ZAİM GÖKBAY

    DOÇ. DR. YUSUF KAYAR

  3. Textile based sensing system for leg motion monitoring

    Bacak hareketi izleme için tekstil tabanlı algılama sistemi

    KADİR ÖZLEM

    Yüksek Lisans

    İngilizce

    İngilizce

    2018

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ GÖKHAN İNCE

  4. Transfer learning based facial emotion recognition and action unit detection

    Transfer öğrenme tabanlı yüz ifadesinden duygu tanıma ve eylem birimi tespiti

    SÜLEYMAN ENGİN BAĞLAYİCİ

    Yüksek Lisans

    İngilizce

    İngilizce

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. HATİCE KÖSE

  5. Sağlık hizmetlerinde toplam kalite yönetimi uygulamalarında iç müşteri kavramının anlam ve önemi: Akdeniz Üniversitesi Uygulama ve Araştırma Hastanesi'nde hekim ve hemşirelere yönelik bir tahmin araştırması

    The Meaning and importance of internal customer concept for TQM in health care: Satisfaction survey on physician and nurses at Akdeniz University Hospital

    KADRİYE KARAKAŞ

    Yüksek Lisans

    Türkçe

    Türkçe

    1998

    İşletmeAkdeniz Üniversitesi

    İşletme Ana Bilim Dalı

    PROF. DR. FULYA SARVAN