Geri Dön

Makine öğrenimi yöntemleri ile Türkiye istatistiki bölgelerinde COVID-19 yaygınlığının analizi

Analysis of the preference of COVID-19 in statistical regions of Turkey by machine learning methods

  1. Tez No: 728082
  2. Yazar: HATİCE NUR CANPOLAT
  3. Danışmanlar: PROF. DR. ERTAN GÜNER
  4. Tez Türü: Yüksek Lisans
  5. Konular: Endüstri ve Endüstri Mühendisliği, Industrial and Industrial Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2022
  8. Dil: Türkçe
  9. Üniversite: Gazi Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Endüstri Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 91

Özet

Çin'in Wuhan eyaletinde Aralık 2019'da ortaya çıkan COVID-19 salgını, kısa zaman içinde bütün dünyaya yayılmıştır. Dünya üzerindeki COVID-19 hasta sayısının 12 Kasım 2021 tarihi itibariyle 252 milyon 44 bin 337'e ulaştığı, ölümlü vaka sayısının ise 5 milyon 82 bin 431 olduğu görülmektedir. COVID-19 salgınına benzer küresel salgın durumlarında bir ülkenin sağlık sisteminde oluşacak yükün önceden tahmin edilmesi ise hayati derecede önemlidir. Bu çalışmada ise literatürde tahminleme ile ilgili yer alan uygulamalarda etkili performans gösteren rastgele orman regresyonu (RFR), bayes sırt regresyon (BRR) ve lineer regresyon (LR) algoritmaları Türkiye'de COVID-19 salgınının yaygınlığını tahmin etmek amacıyla kullanılmıştır. Çalışmanın literatüre katkısı, Türkiye'nin 12 istatistiki bölgesi COVID-19 vaka sayısını tahmin etmek amacıyla modellerin ayrı ayrı oluşturulmuş olmasıdır. Bölge bazlı vaka sayılarının tahmin edilmesindeki esas amaç farklı iklim ve farklı demografi koşullarının salgınların genel yayılımını etkileyen ana unsurlardan olmasıdır. Ülkeler geneli tahmin modellerinde bölgesel yayılım farklılıklarının oluşturabileceği kısıtlar göz ardı edildiğinden, bölge bazlı tahminlerde daha gerçekçi ve net tahmin modelleri söz konusudur. Elde edilen sonuçlara göre İstanbul bölgesinde R2=0,98 değeri ile RFR modeli bütün bölgeler için en yüksek tahmin performansını göstermiştir. Aynı bölge için LR modeli R2=0,69 iken BRR modeli R2=0,57 değeri ile diğer tahmin modellerinin gerisinde kalmıştır. Bu çalışmanın sonuçları göz önünde bulundurulacak olursa makine öğrenimi temelli regresyon algoritmalarının, çeşitli zaman serisi verileri veya üstel dağılımlı yüksek tahmin güçlüğü olan dalgalı veri setlerinde de etkili analizler gerçekleştirebildiği görülmektedir.

Özet (Çeviri)

The COVID-19 epidemic, which emerged in December 2019 in Wuhan, China, has taken the whole world under its influence in a short time. It is seen that the number of COVID-19 patients in the world has reached 252 million 44 thousand 337 as of 12 November 2021, and the number of fatal cases is 5 million 82 thousand 431. It is vitally important to predict the burden that will occur in a country's health system in global epidemic situations similar to the COVID-19 epidemic. In this study, random forest regression (RFR), Bayesian ridge regression (BRR) and linear regression (LR) algorithms, which show effective performance in the prediction applications in the literature, were used to predict the prevalence of the COVID-19 epidemic in Turkey. The contribution of the study to the literature is that models were created separately to estimate the number of COVID-19 cases in 12 statistical regions of Turkey. The main purpose of estimating the number of cases by region is that different climatic and different demographic conditions are the main factors affecting the general spread of epidemics. Since the constraints that can be created by regional spread differences are ignored in the forecast models across countries, there are more realistic and clear forecast models in region-based forecasts. According to the obtained results, the RFR model is considered the highest estimate for the whole, with the value of R2=0,98 in the Istanbul region. For the same region, while the LR model was R2=0,69, the BRR model lagged behind other estimation models with R2 =0,57. Considering the results of this study, it is seen that machine learning-based regression algorithms can also perform effective analyzes on various time series data or exponentially distributed fluctuating data sets with high estimation difficulty.

Benzer Tezler

  1. Estimation of PM10 variations in the Southeastern and Eastern Anatolia regions of Türkiye using remote sensing and statistical models

    Türkiye'nin Güneydoğu ve Doğu Anadolu bölgelerindeki PM10 değişimlerinin uzaktan algılama ve ı̇statistiksel modeller kullanılarak tahmini

    SULTANAY MURZAEVA

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Bilim ve Teknolojiİstanbul Teknik Üniversitesi

    İklim ve Deniz Bilimleri Ana Bilim Dalı

    PROF. DR. ALPER ÜNAL

  2. Classification of abnormal respiratory sounds using deep learning techniques

    Solunum seslerinin derin öğrenme yöntemleri ile sınıflandırılması

    AHAMADI ABDALLAH IDRISSE

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi Üniversitesi

    Bilgisayar Bilimleri Ana Bilim Dalı

    DOÇ. DR. OKTAY YILDIZ

  3. Veri madenciliği yöntemleri ile ana harcama gruplarının paylarının tahmini

    Estimation of main expenditure groups' portion with data mining methods

    LEVENT AHİ

    Yüksek Lisans

    Türkçe

    Türkçe

    2015

    İstatistikHacettepe Üniversitesi

    İstatistik Ana Bilim Dalı

    PROF. DR. MURTAZA ÖZGÜR YENİAY

  4. Early warning model with machine learning for Turkish Insurance Sector

    Türk Sigorta Sektörü için makine öğrenimi ile erken uyarı modeli

    GÜNAY BURAK KOÇER

    Yüksek Lisans

    İngilizce

    İngilizce

    2019

    Aktüerya BilimleriOrta Doğu Teknik Üniversitesi

    Finansal Matematik Ana Bilim Dalı

    PROF. DR. AYŞE SEVTAP KESTEL

  5. Makine öğrenmesi yöntemleri ile faizsiz finansman sektöründe müşteri kayıp tahmini: Churn analizi

    Customer loss forecast in the interest free finance sectorwith machine learning methods: Churn analysis

    AYŞEGÜL KABA

    Yüksek Lisans

    Türkçe

    Türkçe

    2021

    İstatistikMimar Sinan Güzel Sanatlar Üniversitesi

    İstatistik Ana Bilim Dalı

    PROF. DR. BARIŞ AŞIKGİL