Veri madenciliğinde sınıflandırma ve kümeleme algoritmaları ile COVID-19 şüphesi taşıyan hastaların değerlendirilmesi
Evaluation of patients with suspected of covid-19 using classification and clustering algorithms in data mining
- Tez No: 877526
- Danışmanlar: DOÇ. DR. ASLI ÇALIŞ BOYACI
- Tez Türü: Yüksek Lisans
- Konular: Endüstri ve Endüstri Mühendisliği, Industrial and Industrial Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2024
- Dil: Türkçe
- Üniversite: Ondokuz Mayıs Üniversitesi
- Enstitü: Lisansüstü Eğitim Enstitüsü
- Ana Bilim Dalı: Akıllı Sistemler Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 127
Özet
Veri madenciliği büyük hacimdeki karmaşık verilerin işlenebilmesine olanak sağlayarak, anlamlı bilgi ve örüntüleri ortaya çıkararır. Böylece karar vericilerin karar süreçlerine destek olur. Günümüzde karar verme sürecine ihtiyaç duyulan birçok sektörde olduğu gibi sağlık sektöründe de veri madenciliği teknikleri yaygın bir şekilde kullanılmaktadır. Koronavirüs pandemisi ilk günden itibaren tüm dünyayı fiziksel, mental ve ekonomik olarak tehdit etmiştir. Türkiye'de etkileri ağırlıklı olarak 2020-2022 yıllarında hissedilmiş olsa da, Koronavirüs hastalığı yok olmamış olup etkilerini sürdürmektedir. Koronavirüs hastalığı ve pandemi dönemi hala anlaşılmaya çalışılmakta, konuyla ilgili güncel çalışma ve yayımlar devam etmektedir. Bu bağlamda hastalığı anlamak; teşhis konulması, bireylere ve ülkelere olan etkilerin azaltılması ve alınacak önlemler açısından son derece kritik bir rol oynamaktadır. Bu çalışmada, COVID-19 şüphesi ile hastaneye başvurarak test yaptırmış olan hastaların sınıflandırma algoritmaları kullanılarak test sonuçlarının tahmin edilmesi ve kümeleme analizi ile test sonucu pozitif ve negatif olan hastalara ilişkin değerlendirmelerin yapılması amaçlanmaktadır. Sınıflandırma için oluşturulan veri seti karar ağacı, K-en yakın komşu, Naive Bayes, lojistik regresyon, rastgele orman ve destek vektör makineleri algoritmalarıyla KNIME 5.2.2 kullanılarak modellenmiştir. En yüksek doğruluk oranı 0,796 ve en yüksek tanısal üstünlük oranı 15,340 ile rastgele orman modelinde elde edilmiştir. En düşük doğruluk 0,690 ve en düşük tanısal üstünlük oranı 5,729 değeri ile K-en yakın komşu modelinde elde edilmiştir. Kümeleme aşamasında veri seti, COVID-19 test sonucu negatif ve pozitif olan hastalar için ayrılmış, iki ayrı iki aşamalı kümeleme analizi gerçekleştirilmiştir. Uygulama için SPSS Clementine 12.0 programı kullanılmıştır. Her iki durumda da iki küme elde edilmiştir.
Özet (Çeviri)
Data mining enables the processing of large volumes of complex data and reveals meaningful information and patterns. Thus, it supports the decision processes of decision makers. Today, data mining techniques are widely used in the health sector, as in many sectors where decision-making is needed. The coronavirus pandemic has threatened the whole world physically, mentally and economically since day one. Although its effects were felt mainly in 2020-2022 in Turkey, the coronavirus disease has not disappeared and continues its effects. The coronavirus disease and the pandemic period are still being understood, and current studies and publications on the subject continue. In this context, understanding the disease plays a critical role in terms of diagnosis, reducing the effects on individuals and countries, and the measures to be taken. This study aims to predict the test results of patients who have been tested by applying to the hospital with suspicion of COVID-19 by using classification algorithms and to make evaluations of patients with positive and negative test results using cluster analysis. For classification, the created data set was modeled using KNIME 5.2.2 with decision tree, K-nearest neighbor, Naive Bayes, logistic regression, random forest and support vector machines algorithms. The highest accuracy rate of 0.796 and the highest diagnostic superiority rate of 15.340 were obtained in the random forest model. The lowest accuracy was obtained in the K-nearest neighbor model with a value of 0.690 and the lowest diagnostic superiority rate with a value of 5.729. For clustering, the data set was separated for patients with negative and positive COVID-19 test results and two different two-stage clustering analyzes were performed. SPSS Clementine 12.0 program was used for the application. In both cases, two clusters were obtained.
Benzer Tezler
- Türkiye'de mobil veri kullanımının veri madenciliğinde kullanılan algoritmalar ile analizi
Analysis with algorithms used in data mining of mobile data usage in Turkey
MUHAMMET ALİ ALTINIŞIK
Yüksek Lisans
Türkçe
2017
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolMaltepe ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. ERDAL GÜVENOĞLU
- Anomalous network packet detection
Anomal ağ paketi tespiti
AHMED MOHAMMED
Yüksek Lisans
İngilizce
2015
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolÇankaya ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. SİBEL TARIYAN ÖZYER
- Evaluation of the relationship between the stability of feature selection techniques and classification performance in data mining
Veri madenciliğinde öznitelik seçim tekniklerinin kararlılıkları ve sınıflandırma performansları arasındaki ilişkinin değerlendirilmesi
MUSTAFA BÜYÜKKEÇECİ
Doktora
İngilizce
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolYaşar ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. MEHMET CUDİ OKUR
- Link analizi ve bir iletişim şebekesi uygulaması
Link analysis and a communication network application
FATMA ŞEBNEM AKAL
Doktora
Türkçe
2010
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Üniversitesiİşletme Bölümü
DOÇ. DR. MEHPARE TİMOR
PROF. DR. HALDUN AKPINAR
- Veri madenciliği uygulamalarında ağaç tohum algoritmasının kullanımı
Using tree seed algorithm on data mining applications
ABDÜLKADİR PEKTAŞ
Yüksek Lisans
Türkçe
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolNecmettin Erbakan ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ONUR İNAN