Makine öğrenimi yöntemleri ile Türkiye istatistiki bölgelerinde COVID-19 yaygınlığının analizi
Analysis of the preference of COVID-19 in statistical regions of Turkey by machine learning methods
- Tez No: 728082
- Danışmanlar: PROF. DR. ERTAN GÜNER
- Tez Türü: Yüksek Lisans
- Konular: Endüstri ve Endüstri Mühendisliği, Industrial and Industrial Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2022
- Dil: Türkçe
- Üniversite: Gazi Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Endüstri Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 91
Özet
Çin'in Wuhan eyaletinde Aralık 2019'da ortaya çıkan COVID-19 salgını, kısa zaman içinde bütün dünyaya yayılmıştır. Dünya üzerindeki COVID-19 hasta sayısının 12 Kasım 2021 tarihi itibariyle 252 milyon 44 bin 337'e ulaştığı, ölümlü vaka sayısının ise 5 milyon 82 bin 431 olduğu görülmektedir. COVID-19 salgınına benzer küresel salgın durumlarında bir ülkenin sağlık sisteminde oluşacak yükün önceden tahmin edilmesi ise hayati derecede önemlidir. Bu çalışmada ise literatürde tahminleme ile ilgili yer alan uygulamalarda etkili performans gösteren rastgele orman regresyonu (RFR), bayes sırt regresyon (BRR) ve lineer regresyon (LR) algoritmaları Türkiye'de COVID-19 salgınının yaygınlığını tahmin etmek amacıyla kullanılmıştır. Çalışmanın literatüre katkısı, Türkiye'nin 12 istatistiki bölgesi COVID-19 vaka sayısını tahmin etmek amacıyla modellerin ayrı ayrı oluşturulmuş olmasıdır. Bölge bazlı vaka sayılarının tahmin edilmesindeki esas amaç farklı iklim ve farklı demografi koşullarının salgınların genel yayılımını etkileyen ana unsurlardan olmasıdır. Ülkeler geneli tahmin modellerinde bölgesel yayılım farklılıklarının oluşturabileceği kısıtlar göz ardı edildiğinden, bölge bazlı tahminlerde daha gerçekçi ve net tahmin modelleri söz konusudur. Elde edilen sonuçlara göre İstanbul bölgesinde R2=0,98 değeri ile RFR modeli bütün bölgeler için en yüksek tahmin performansını göstermiştir. Aynı bölge için LR modeli R2=0,69 iken BRR modeli R2=0,57 değeri ile diğer tahmin modellerinin gerisinde kalmıştır. Bu çalışmanın sonuçları göz önünde bulundurulacak olursa makine öğrenimi temelli regresyon algoritmalarının, çeşitli zaman serisi verileri veya üstel dağılımlı yüksek tahmin güçlüğü olan dalgalı veri setlerinde de etkili analizler gerçekleştirebildiği görülmektedir.
Özet (Çeviri)
The COVID-19 epidemic, which emerged in December 2019 in Wuhan, China, has taken the whole world under its influence in a short time. It is seen that the number of COVID-19 patients in the world has reached 252 million 44 thousand 337 as of 12 November 2021, and the number of fatal cases is 5 million 82 thousand 431. It is vitally important to predict the burden that will occur in a country's health system in global epidemic situations similar to the COVID-19 epidemic. In this study, random forest regression (RFR), Bayesian ridge regression (BRR) and linear regression (LR) algorithms, which show effective performance in the prediction applications in the literature, were used to predict the prevalence of the COVID-19 epidemic in Turkey. The contribution of the study to the literature is that models were created separately to estimate the number of COVID-19 cases in 12 statistical regions of Turkey. The main purpose of estimating the number of cases by region is that different climatic and different demographic conditions are the main factors affecting the general spread of epidemics. Since the constraints that can be created by regional spread differences are ignored in the forecast models across countries, there are more realistic and clear forecast models in region-based forecasts. According to the obtained results, the RFR model is considered the highest estimate for the whole, with the value of R2=0,98 in the Istanbul region. For the same region, while the LR model was R2=0,69, the BRR model lagged behind other estimation models with R2 =0,57. Considering the results of this study, it is seen that machine learning-based regression algorithms can also perform effective analyzes on various time series data or exponentially distributed fluctuating data sets with high estimation difficulty.
Benzer Tezler
- Estimation of PM10 variations in the Southeastern and Eastern Anatolia regions of Türkiye using remote sensing and statistical models
Türkiye'nin Güneydoğu ve Doğu Anadolu bölgelerindeki PM10 değişimlerinin uzaktan algılama ve ı̇statistiksel modeller kullanılarak tahmini
SULTANAY MURZAEVA
Yüksek Lisans
İngilizce
2024
Bilim ve Teknolojiİstanbul Teknik Üniversitesiİklim ve Deniz Bilimleri Ana Bilim Dalı
PROF. DR. ALPER ÜNAL
- Classification of abnormal respiratory sounds using deep learning techniques
Solunum seslerinin derin öğrenme yöntemleri ile sınıflandırılması
AHAMADI ABDALLAH IDRISSE
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi ÜniversitesiBilgisayar Bilimleri Ana Bilim Dalı
DOÇ. DR. OKTAY YILDIZ
- Veri madenciliği yöntemleri ile ana harcama gruplarının paylarının tahmini
Estimation of main expenditure groups' portion with data mining methods
LEVENT AHİ
Yüksek Lisans
Türkçe
2015
İstatistikHacettepe Üniversitesiİstatistik Ana Bilim Dalı
PROF. DR. MURTAZA ÖZGÜR YENİAY
- Early warning model with machine learning for Turkish Insurance Sector
Türk Sigorta Sektörü için makine öğrenimi ile erken uyarı modeli
GÜNAY BURAK KOÇER
Yüksek Lisans
İngilizce
2019
Aktüerya BilimleriOrta Doğu Teknik ÜniversitesiFinansal Matematik Ana Bilim Dalı
PROF. DR. AYŞE SEVTAP KESTEL
- Makine öğrenmesi yöntemleri ile faizsiz finansman sektöründe müşteri kayıp tahmini: Churn analizi
Customer loss forecast in the interest free finance sectorwith machine learning methods: Churn analysis
AYŞEGÜL KABA
Yüksek Lisans
Türkçe
2021
İstatistikMimar Sinan Güzel Sanatlar Üniversitesiİstatistik Ana Bilim Dalı
PROF. DR. BARIŞ AŞIKGİL