Veri madenciliği yöntemleri ile tam kan sayımı sonuçlarından COVID-19 test sonuçlarının tahmini
Estimation of COVID-19 test results from complete blood count results with data mining methods
- Tez No: 676154
- Danışmanlar: DR. ÖĞR. ÜYESİ AYŞE MERVE ACILAR, DR. ÖĞR. ÜYESİ CENGİZ SERTKAYA
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2021
- Dil: Türkçe
- Üniversite: Necmettin Erbakan Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 65
Özet
2019 yılında Çin'in Wuhan kentinde ilk vakaları görülen COVID-19 hastalığı tüm dünyayı etkisi altına almıştır. Başlangıçta sebebi belli olmadığı ve grip, soğuk algınlığı gibi hastalıklarla benzer etkileriyle karşılaşıldığı için hızla yayılmış ve Dünya Sağlık Örgütü tarafından pandemi olarak ilan edilmiştir. Hastalığın hızla yayılımının önüne geçmek ve teşhisini hızlandırmak için yeni yöntemler aranarak, makine öğrenmesi algoritmalarından faydalanılmıştır. COVID-19 şüphesi ile hastanelere ulaşan bireyler içerisinde hastane verileri bir araya getirilerek veri setleri oluşturulmuştur. Brezilya'daki Albert Einstein Hastane' sini ziyaret eden bireylere ait rutin kan sayımı sonuçları ve COVID-19 test sonuçları kullanılarak oluşturulan bu tez çalışmasında, eksik verilerin tamamlanması için K-En Yakın Komşu(KNN) algoritması, dengesiz veri problemi için SMOTE algoritması, gürültülü verilerin temizlenmesi için dağılım grafikleri ve özellik seçimi için Temel Bileşen Analizi (TBA) kullanılarak veri seti oluşturulmuştur. Oluşturulan veri seti makine öğrenmesi algoritmalarından Destek Vektör Makineleri, Rastgele Orman ve Naive Bayes algoritmalarıyla sınıflandırılarak test edilmiştir. Elde edilen sonuçlar ışığında Rastgele Orman algoritması %99.2 genel doğruluk ile en yüksek başarıyı elde etmiştir.
Özet (Çeviri)
The COVID-19 disease, the first cases of which were seen in Wuhan, China in 2019, has affected the whole world. It spread rapidly and was declared a pandemic by the World Health Organization, as the cause was not clear at the beginning and similar effects were encountered with diseases such as flu and colds. In order to prevent the rapid spread of the disease and to accelerate its diagnosis, new methods were sought and machine learning algorithms were used. Data sets were created by bringing together hospital data among individuals who reached hospitals with the suspicion of COVID-19. In this thesis study, which was created using routine blood count results and COVID-19 test results of individuals visiting Albert Einstein Hospital in Brazil, the K-Nearest Neighbor (KNN) algorithm to complete the missing data, the SMOTE algorithm for the unbalanced data problem, the noisy data. The data set was created using scatter plots to clean up the data and Principal Component Analysis (PCA) for feature selection. The generated data set has been tested by classifying with Support Vector Machines, Random Forest and Naive Bayes algorithms from machine learning algorithms. In the light of the results obtained, the Random Forest algorithm achieved the highest success with an overall accuracy of 99.2%.
Benzer Tezler
- Veri madenciliği yöntemlerini kullanarak anemi sınıflandırılmasına yönelik bir uygulama
Classification of anemia using data mining methods: An application
BETÜL MERVE FAKI
Yüksek Lisans
Türkçe
2015
Endüstri ve Endüstri Mühendisliğiİstanbul Teknik ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. BAŞAR ÖZTAYŞİ
- Çok küçük preterm bebeklerde erken neonatal dönemdeki kan hücre ve indekslerinin morbidite ve mortaliteyi öngörmedeki rolü
Role of early complete blood count parameters to predict morbities and mortality in very preterm babies.
CAN AKYILDIZ
Tıpta Uzmanlık
Türkçe
2019
Çocuk Sağlığı ve HastalıklarıDokuz Eylül ÜniversitesiÇocuk Sağlığı ve Hastalıkları Ana Bilim Dalı
DOÇ. DR. FUNDA TÜZÜN
- Prediction of COVID 19 disease using chest X-ray images based on deep learning
Derin öğrenmeye dayalı göğüs röntgen görüntüleri kullanarak COVID 19 hastalığının tahmini
ISMAEL ABDULLAH MOHAMMED AL-RAWE
Yüksek Lisans
İngilizce
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. ADEM TEKEREK
- Diyabet hastalarındaki hba1c parametresine etki eden faktörlerin veri madenciliği yöntemleri ile tahmin edilmesi
Prediction by data mining methods of the factors affecting hba1c parameter in diabetic patients
ALİ ŞAŞAR
Yüksek Lisans
Türkçe
2017
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolMuğla Sıtkı Koçman ÜniversitesiBilişim Sistemleri Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. OSMAN ÖZKARACA
- Karadeniz Teknik Üniversitesi Farabi Hastanesi Biyokimya Laboratuvarı test sonuçlarından veri madenciliği yolu ile örüntü çıkarma
Pattern extraction from Karadeniz Technical University Farabi Hospital Biochemistry Laboratory medical tests using data mining techniques
YASEMİN ZEYNEP ENGİN
Yüksek Lisans
Türkçe
2014
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKaradeniz Teknik ÜniversitesiTıp Bilişimi Ana Bilim Dalı
DOÇ. DR. KEMAL TURHAN