Geri Dön

Veri madenciliği yöntemleri ile tam kan sayımı sonuçlarından COVID-19 test sonuçlarının tahmini

Estimation of COVID-19 test results from complete blood count results with data mining methods

  1. Tez No: 676154
  2. Yazar: AYBÜKE BOZKURT
  3. Danışmanlar: DR. ÖĞR. ÜYESİ AYŞE MERVE ACILAR, DR. ÖĞR. ÜYESİ CENGİZ SERTKAYA
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2021
  8. Dil: Türkçe
  9. Üniversite: Necmettin Erbakan Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 65

Özet

2019 yılında Çin'in Wuhan kentinde ilk vakaları görülen COVID-19 hastalığı tüm dünyayı etkisi altına almıştır. Başlangıçta sebebi belli olmadığı ve grip, soğuk algınlığı gibi hastalıklarla benzer etkileriyle karşılaşıldığı için hızla yayılmış ve Dünya Sağlık Örgütü tarafından pandemi olarak ilan edilmiştir. Hastalığın hızla yayılımının önüne geçmek ve teşhisini hızlandırmak için yeni yöntemler aranarak, makine öğrenmesi algoritmalarından faydalanılmıştır. COVID-19 şüphesi ile hastanelere ulaşan bireyler içerisinde hastane verileri bir araya getirilerek veri setleri oluşturulmuştur. Brezilya'daki Albert Einstein Hastane' sini ziyaret eden bireylere ait rutin kan sayımı sonuçları ve COVID-19 test sonuçları kullanılarak oluşturulan bu tez çalışmasında, eksik verilerin tamamlanması için K-En Yakın Komşu(KNN) algoritması, dengesiz veri problemi için SMOTE algoritması, gürültülü verilerin temizlenmesi için dağılım grafikleri ve özellik seçimi için Temel Bileşen Analizi (TBA) kullanılarak veri seti oluşturulmuştur. Oluşturulan veri seti makine öğrenmesi algoritmalarından Destek Vektör Makineleri, Rastgele Orman ve Naive Bayes algoritmalarıyla sınıflandırılarak test edilmiştir. Elde edilen sonuçlar ışığında Rastgele Orman algoritması %99.2 genel doğruluk ile en yüksek başarıyı elde etmiştir.

Özet (Çeviri)

The COVID-19 disease, the first cases of which were seen in Wuhan, China in 2019, has affected the whole world. It spread rapidly and was declared a pandemic by the World Health Organization, as the cause was not clear at the beginning and similar effects were encountered with diseases such as flu and colds. In order to prevent the rapid spread of the disease and to accelerate its diagnosis, new methods were sought and machine learning algorithms were used. Data sets were created by bringing together hospital data among individuals who reached hospitals with the suspicion of COVID-19. In this thesis study, which was created using routine blood count results and COVID-19 test results of individuals visiting Albert Einstein Hospital in Brazil, the K-Nearest Neighbor (KNN) algorithm to complete the missing data, the SMOTE algorithm for the unbalanced data problem, the noisy data. The data set was created using scatter plots to clean up the data and Principal Component Analysis (PCA) for feature selection. The generated data set has been tested by classifying with Support Vector Machines, Random Forest and Naive Bayes algorithms from machine learning algorithms. In the light of the results obtained, the Random Forest algorithm achieved the highest success with an overall accuracy of 99.2%.

Benzer Tezler

  1. Veri madenciliği yöntemlerini kullanarak anemi sınıflandırılmasına yönelik bir uygulama

    Classification of anemia using data mining methods: An application

    BETÜL MERVE FAKI

    Yüksek Lisans

    Türkçe

    Türkçe

    2015

    Endüstri ve Endüstri Mühendisliğiİstanbul Teknik Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. BAŞAR ÖZTAYŞİ

  2. Çok küçük preterm bebeklerde erken neonatal dönemdeki kan hücre ve indekslerinin morbidite ve mortaliteyi öngörmedeki rolü

    Role of early complete blood count parameters to predict morbities and mortality in very preterm babies.

    CAN AKYILDIZ

    Tıpta Uzmanlık

    Türkçe

    Türkçe

    2019

    Çocuk Sağlığı ve HastalıklarıDokuz Eylül Üniversitesi

    Çocuk Sağlığı ve Hastalıkları Ana Bilim Dalı

    DOÇ. DR. FUNDA TÜZÜN

  3. Prediction of COVID 19 disease using chest X-ray images based on deep learning

    Derin öğrenmeye dayalı göğüs röntgen görüntüleri kullanarak COVID 19 hastalığının tahmini

    ISMAEL ABDULLAH MOHAMMED AL-RAWE

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. ADEM TEKEREK

  4. Diyabet hastalarındaki hba1c parametresine etki eden faktörlerin veri madenciliği yöntemleri ile tahmin edilmesi

    Prediction by data mining methods of the factors affecting hba1c parameter in diabetic patients

    ALİ ŞAŞAR

    Yüksek Lisans

    Türkçe

    Türkçe

    2017

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolMuğla Sıtkı Koçman Üniversitesi

    Bilişim Sistemleri Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. OSMAN ÖZKARACA

  5. Karadeniz Teknik Üniversitesi Farabi Hastanesi Biyokimya Laboratuvarı test sonuçlarından veri madenciliği yolu ile örüntü çıkarma

    Pattern extraction from Karadeniz Technical University Farabi Hospital Biochemistry Laboratory medical tests using data mining techniques

    YASEMİN ZEYNEP ENGİN

    Yüksek Lisans

    Türkçe

    Türkçe

    2014

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKaradeniz Teknik Üniversitesi

    Tıp Bilişimi Ana Bilim Dalı

    DOÇ. DR. KEMAL TURHAN