Sağlık bilimlerinde veri ön işleme
Data preprocessing in health sciences
- Tez No: 781243
- Danışmanlar: PROF. DR. SEVİNÇ GÜLSEÇEN
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2023
- Dil: Türkçe
- Üniversite: İstanbul Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Enformatik Ana Bilim Dalı
- Bilim Dalı: Enformatik Bilim Dalı
- Sayfa Sayısı: 82
Özet
Günümüzde her alanda olduğu gibi sağlık alanında da veri madenciliği, istatistik, makine öğrenmesi gibi çalışmalar yapılmaktadır. Her an gelişerek devam eden bu çalışmalar sağlık alanda sıklıkla kullanılmakta ve çeşitli faydalar sağlamaktadır. Fakat her ne kadar faydalı olsa da yanlış uygulamalar yapılması durumunda insan hayatını etkileyebilecek olumsuz etkileri de bulunmaktadır. Bu sebeple veri madenciliği, istatistik veya makine öğrenmesi çalışmalarının hayati önem taşıyan sağlık alanında dikkatli şekilde yapılması gerektirmektedir. Sağlık verisi genellikle eksik değer içeren, gürültülü ve dengesiz verilerdir. Veri madenciliği, istatistik veya makine öğrenmesi çalışması ile doğruluk oranı ve güvenilirliği yüksek sonuca ulaşabilmek için kullanılacak olan verinin ilgili çalışmaya uygun hale getirilmesi gerekmektedir. Bu sebeple verinin veri ön işleme sürecinden geçirilmesi önem arz etmektedir. Bu tez çalışmasında veri ön işleme yöntemlerine odaklanılmış ve bir veri seti kullanılarak sağlık alanında veri ön işleme yöntemlerinin kullanımına yönelik örnek olması için bir uygulama gerçekleştirilmiştir. Tez kapsamında kullanılan veri seti Meme Sağlığı Derneği (MEMEDER)'nden anonim olarak temin edilmiş, 8825 satır ve 5567 sütundan oluşan retrospektif bir veri setidir. Veri seti ile çalışma yapılabilmesi yapılan başvuru 24/06/2022 tarihli ve 12 sayılı etik kurulda görüşülmüş, 2022/896 dosya numarası ile etik kurul tarafından onay alınmıştır. Veri seti incelenmiş ve veri temizleme, veri indirgeme ve veri dönüştürme ön işlemleri veri setine uygulanmıştır. Uygulaması yapılan veri ön işleme yöntemleri, veri seti ile kümeleme çalışması yapılacağı düşünülerek seçilmiştir. Bu uygulama sonucunda 8825 satır ve 50 sütundan oluşan bir veri seti elde edilmiştir. Yapılan bu uygulamalar ile veri seti eksik ve aykırı değer içermeyen, daha küçük boyutlu veri madenciliği, istatistik ve makine öğrenmesi çalışmalarına uygun bir veri seti haline getirilmiştir. Gelecek çalışmalarda veri ön işleme yöntemleri birden fazla sağlık verisi kullanılarak farklı veri setleri üzerindeki uygulamalarına örnekler verilebilir ve farklı veri setleri üzerindeki performansı karşılaştırılarak her veri seti için en iyi alternatifi bulmak üzerine çalışmalar geliştirilebilir.
Özet (Çeviri)
Nowadays, studies such as data mining, statistics and machine learning are carried out in the field of health as in every field. These studies, which continue to develop at every moment, are frequently used in the field of health and provide various benefits. However, although it is beneficial, it also has negative effects that can affect human life in case of wrong implementation. Therefore, data mining, statistics or machine learning studies need to be done carefully in the field of health, which is of vital importance. Health data is generally incomplete, noisy and unstable data. In order to achieve high accuracy and reliability results with data mining, statistics or machine learning study, the data to be used should be made suitable for the relevant study. Therefore, it is important to pass the data through the data preprocessing process. In this thesis focuses on data preprocessing methods and an implementation was carried out to set an example for the use of data preprocessing methods in the field of health by using a data set. The data set used in the thesis is a restrospective data set consisting of 8825 rows and 5567 columns, obtained anonymously from the Breast Health Association (MEMEDER). The application to be able to work with the data set was discussed at the ethics committee dated 24/06/2022 and numbered 12, and approval was received by the ethics committee with the file number 2022/896. The data set was examined and data cleaning, data reduction and data transformation preprocesses were applied to the data set. The implemented data preprocessing methods have been chosen considering that clustering study will be done with the data set. As a result of this implementation, a data set consisting of 8825 rows and 50 columns was obtained. With these implementations, the data set is made into a smaller size data set that does not contain missing or outliers and was prepared for data mining, statistics and machine learning studies. In future studies, examples of applications of data preprocessing methods on different datasets can be given by using more than one health data and studies can be developed to find the best alternative for each dataset.
Benzer Tezler
- Kişisel verilerin korunması hukuku bağlamında sağlık bilimlerinde yapay zeka kullanımı
Use of artificial intelligence in health sciences in the context of personal data protection law
ELİF ILGIN ÖZCAN
Yüksek Lisans
Türkçe
2023
HukukAkdeniz ÜniversitesiSağlık Hukuku Ana Bilim Dalı
DOÇ. DR. SELİN SERT SÜTÇÜ
- Mathematical model-based clinical decision support system algorithm design study that can support the diagnosis of celiac disease
Çölyak hastalığının teşhisine destek verebilecek matematik model tabanlı kds algoritması tasarımı
ELİF KESKİN BİLGİÇ
Doktora
İngilizce
2024
Mühendislik Bilimleriİstanbul Üniversitesi-CerrahpaşaBiyomedikal Mühendisliği Ana Bilim Dalı
DR. İNCİ ZAİM GÖKBAY
DOÇ. DR. YUSUF KAYAR
- Textile based sensing system for leg motion monitoring
Bacak hareketi izleme için tekstil tabanlı algılama sistemi
KADİR ÖZLEM
Yüksek Lisans
İngilizce
2018
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ GÖKHAN İNCE
- Transfer learning based facial emotion recognition and action unit detection
Transfer öğrenme tabanlı yüz ifadesinden duygu tanıma ve eylem birimi tespiti
SÜLEYMAN ENGİN BAĞLAYİCİ
Yüksek Lisans
İngilizce
2021
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. HATİCE KÖSE
- Sağlık hizmetlerinde toplam kalite yönetimi uygulamalarında iç müşteri kavramının anlam ve önemi: Akdeniz Üniversitesi Uygulama ve Araştırma Hastanesi'nde hekim ve hemşirelere yönelik bir tahmin araştırması
The Meaning and importance of internal customer concept for TQM in health care: Satisfaction survey on physician and nurses at Akdeniz University Hospital
KADRİYE KARAKAŞ