Geri Dön

Veri madenciliğinde sınıflandırma ve kümeleme algoritmaları ile COVID-19 şüphesi taşıyan hastaların değerlendirilmesi

Evaluation of patients with suspected of covid-19 using classification and clustering algorithms in data mining

  1. Tez No: 877526
  2. Yazar: BEYZA DURMAZ
  3. Danışmanlar: DOÇ. DR. ASLI ÇALIŞ BOYACI
  4. Tez Türü: Yüksek Lisans
  5. Konular: Endüstri ve Endüstri Mühendisliği, Industrial and Industrial Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2024
  8. Dil: Türkçe
  9. Üniversite: Ondokuz Mayıs Üniversitesi
  10. Enstitü: Lisansüstü Eğitim Enstitüsü
  11. Ana Bilim Dalı: Akıllı Sistemler Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 127

Özet

Veri madenciliği büyük hacimdeki karmaşık verilerin işlenebilmesine olanak sağlayarak, anlamlı bilgi ve örüntüleri ortaya çıkararır. Böylece karar vericilerin karar süreçlerine destek olur. Günümüzde karar verme sürecine ihtiyaç duyulan birçok sektörde olduğu gibi sağlık sektöründe de veri madenciliği teknikleri yaygın bir şekilde kullanılmaktadır. Koronavirüs pandemisi ilk günden itibaren tüm dünyayı fiziksel, mental ve ekonomik olarak tehdit etmiştir. Türkiye'de etkileri ağırlıklı olarak 2020-2022 yıllarında hissedilmiş olsa da, Koronavirüs hastalığı yok olmamış olup etkilerini sürdürmektedir. Koronavirüs hastalığı ve pandemi dönemi hala anlaşılmaya çalışılmakta, konuyla ilgili güncel çalışma ve yayımlar devam etmektedir. Bu bağlamda hastalığı anlamak; teşhis konulması, bireylere ve ülkelere olan etkilerin azaltılması ve alınacak önlemler açısından son derece kritik bir rol oynamaktadır. Bu çalışmada, COVID-19 şüphesi ile hastaneye başvurarak test yaptırmış olan hastaların sınıflandırma algoritmaları kullanılarak test sonuçlarının tahmin edilmesi ve kümeleme analizi ile test sonucu pozitif ve negatif olan hastalara ilişkin değerlendirmelerin yapılması amaçlanmaktadır. Sınıflandırma için oluşturulan veri seti karar ağacı, K-en yakın komşu, Naive Bayes, lojistik regresyon, rastgele orman ve destek vektör makineleri algoritmalarıyla KNIME 5.2.2 kullanılarak modellenmiştir. En yüksek doğruluk oranı 0,796 ve en yüksek tanısal üstünlük oranı 15,340 ile rastgele orman modelinde elde edilmiştir. En düşük doğruluk 0,690 ve en düşük tanısal üstünlük oranı 5,729 değeri ile K-en yakın komşu modelinde elde edilmiştir. Kümeleme aşamasında veri seti, COVID-19 test sonucu negatif ve pozitif olan hastalar için ayrılmış, iki ayrı iki aşamalı kümeleme analizi gerçekleştirilmiştir. Uygulama için SPSS Clementine 12.0 programı kullanılmıştır. Her iki durumda da iki küme elde edilmiştir.

Özet (Çeviri)

Data mining enables the processing of large volumes of complex data and reveals meaningful information and patterns. Thus, it supports the decision processes of decision makers. Today, data mining techniques are widely used in the health sector, as in many sectors where decision-making is needed. The coronavirus pandemic has threatened the whole world physically, mentally and economically since day one. Although its effects were felt mainly in 2020-2022 in Turkey, the coronavirus disease has not disappeared and continues its effects. The coronavirus disease and the pandemic period are still being understood, and current studies and publications on the subject continue. In this context, understanding the disease plays a critical role in terms of diagnosis, reducing the effects on individuals and countries, and the measures to be taken. This study aims to predict the test results of patients who have been tested by applying to the hospital with suspicion of COVID-19 by using classification algorithms and to make evaluations of patients with positive and negative test results using cluster analysis. For classification, the created data set was modeled using KNIME 5.2.2 with decision tree, K-nearest neighbor, Naive Bayes, logistic regression, random forest and support vector machines algorithms. The highest accuracy rate of 0.796 and the highest diagnostic superiority rate of 15.340 were obtained in the random forest model. The lowest accuracy was obtained in the K-nearest neighbor model with a value of 0.690 and the lowest diagnostic superiority rate with a value of 5.729. For clustering, the data set was separated for patients with negative and positive COVID-19 test results and two different two-stage clustering analyzes were performed. SPSS Clementine 12.0 program was used for the application. In both cases, two clusters were obtained.

Benzer Tezler

  1. Türkiye'de mobil veri kullanımının veri madenciliğinde kullanılan algoritmalar ile analizi

    Analysis with algorithms used in data mining of mobile data usage in Turkey

    MUHAMMET ALİ ALTINIŞIK

    Yüksek Lisans

    Türkçe

    Türkçe

    2017

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolMaltepe Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. ERDAL GÜVENOĞLU

  2. Anomalous network packet detection

    Anomal ağ paketi tespiti

    AHMED MOHAMMED

    Yüksek Lisans

    İngilizce

    İngilizce

    2015

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolÇankaya Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. SİBEL TARIYAN ÖZYER

  3. Evaluation of the relationship between the stability of feature selection techniques and classification performance in data mining

    Veri madenciliğinde öznitelik seçim tekniklerinin kararlılıkları ve sınıflandırma performansları arasındaki ilişkinin değerlendirilmesi

    MUSTAFA BÜYÜKKEÇECİ

    Doktora

    İngilizce

    İngilizce

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolYaşar Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. MEHMET CUDİ OKUR

  4. Link analizi ve bir iletişim şebekesi uygulaması

    Link analysis and a communication network application

    FATMA ŞEBNEM AKAL

    Doktora

    Türkçe

    Türkçe

    2010

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Üniversitesi

    İşletme Bölümü

    DOÇ. DR. MEHPARE TİMOR

    PROF. DR. HALDUN AKPINAR

  5. Veri madenciliği uygulamalarında ağaç tohum algoritmasının kullanımı

    Using tree seed algorithm on data mining applications

    ABDÜLKADİR PEKTAŞ

    Yüksek Lisans

    Türkçe

    Türkçe

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolNecmettin Erbakan Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ONUR İNAN