Geri Dön

Makine öğrenmesi algoritmaları ile nüfus tahmini: Türkiye örneği

Machine learning algorithms to forecast population: Turkey example

  1. Tez No: 553853
  2. Yazar: FATİH VELİ ŞAHİNARSLAN
  3. Danışmanlar: PROF. DR. FERHAN ÇEBİ
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilim ve Teknoloji, Demografi, İşletme, Science and Technology, Demography, Business Administration
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2019
  8. Dil: Türkçe
  9. Üniversite: İstanbul Teknik Üniversitesi
  10. Enstitü: Sosyal Bilimler Enstitüsü
  11. Ana Bilim Dalı: İşletme Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 89

Özet

Ülkelerin geleceğine dair sosyal, ekonomik, politik ve çevresel kararların daha tutarlı alınabilmesi için ülke nüfusu hakkında bilgi sahibi olunmalıdır. Bu sebeple, büyük maliyetler ile nüfus sayımları yapılmakta ve farklı teknikler ile ülkenin gelecekteki nüfusu tahmin edilmektedir. Bu çalışmada farklı makine öğrenmesi algoritmaları ile nüfus tahmini yapılmıştır. Bunun için altı farklı makine öğrenmesi algoritması seçilmiştir; Light Gradyan Artırma (Light Gradient Boosting, LightGBM), Doğrusal Regresyon, Ridge Regresyon, Üstel Düzeltme yöntemlerinden biri olan Holt-Winters, Bütünleşik Otoregresif Hareketli Ortalama (Autoregressive Integrated Moving Average, ARIMA) ve Prophet tahmin modeli. 262 farklı ülkenin 1960-2017 yılları arasındaki 1595 farklı demografik göstergesi kullanılarak modeller eğitilmiştir. Kullanılan veri seti dünya genelinde demografik göstergeler yayınlayan Dünya Bankası'ndan (World Bank) temin edilmiştir. Makine öğrenmesi algoritmaları Python programlama dili ile Jupyter program arayüzü kullanılarak eğitilmiştir. 2017 yılı toplam nüfusu tahmin edilerek sonuçlar gerçek değerler ile karşılaştırılmıştır. Algoritmaların performansları karşılaştırıldığında, bütün modeller arasından ARIMA modeli en başarılı sonucu vermiştir. Doğrusal regresyon, Ridge regresyon ve Holt-Winters modelleri performans açısından ARIMA modeline yakın sonuçlar vermiştir. Sadece nüfus istatistikleri kullanılarak modeller eğitildiğinde Doğrusal regresyon ve Ridge regresyon modellerinin daha başarılı sonuçlar verdiği gözlemlenmiştir. Ayrıca, eğitilen modeller ile 2017 yılı toplam Türkiye nüfusu tahmin edilmiştir. Kuşak bileşenleri yöntemi (Cohort Component Method) nüfus tahmini için ülkelerin istatistik kurumları tarafından sıkça kullanılan yöntemlerden biridir. Bu yöntem ile nüfus tahmini yapmak için ülkenin nüfus istatistikleri, doğum, ölüm ve göç oranları, doğumda beklenen yaşam süresi ve doğumdaki cinsiyet oranı verileri kullanılır. Makine öğrenmesi algoritmaları ile tahmin edilen 2017 yılı toplam Türkiye nüfusu, kuşak bileşenleri yöntemi ile de tahmin edilerek sonuçlar karşılaştırılmıştır. Ridge regresyon modeli Türkiye'nin nüfusunu altı bin kişi fark ile tahmin ederken, Kuşak bileşenleri yöntemi dört yüz bin kişi fark ile tahmin etmiştir Elde edilen sonuçlara göre, makine öğrenmesi algoritmalarının nüfus tahmin başarısı kuşak bileşenleri yöntemine göre oldukça yüksektir. Makine öğrenmesi algoritmalarının nüfus tahmini üzerinde kullanılması ülkeler için önemli bir katkı sağlayacak ve karar alma sürecini iyileştirecektir.

Özet (Çeviri)

The population of the countries should be known to be more consistent with the social, economic, political and environmental decisions regarding the future of them. For this reason, censuses are made with great cost and the future population of the country is estimated with different techniques. In this study, different machine learning algorithms are used to forecast population. This study employed six different machine learning algorithms; Light Gradient Boosting, Linear Regression, Ridge Regression, Holt-Winters, Exponential Autoregressive Integrated Moving Average (ARIMA) and Prophet Prediction Model. Models were trained using 1595 different demographic indicators of 262 different countries between 1960 and 2017. The data set is obtained from the World Bank, which publishes demographic indicators worldwide. Machine learning algorithms are trained using the Jupyter program interface with Python programming language. The total population of 2017 was estimated and the results were compared with the actual values. When the performance of algorithms was compared, the ARIMA model was the most successful among all models. Linear regression, Ridge regression, and Holt-Winters models were close to the ARIMA model in terms of performance. Linear regression and Ridge regression models showed more successful results when the only total populations data set is trained. In addition, Turkey's total population of 2017 were forecasted with trained models. Cohort Component Method is one of the methods commonly used by countries' statistical institutions for population estimation. With this method, population statistics, birth, death and migration rates, life expectancy at birth and sex ratio at birth are used to estimate the population. The total population of Turkey in 2017 estimated by pre-trained machine learning algorithms were compared with the result predicted by Cohort Component Method. Ridge regression model estimated Turkey's population with six thousand people difference while Cohort Component Method predicted with 400 thousand people difference. Results showed that machine learning algorithms performed better than the demographic model. Therefore, using machine learning algorithms on population estimation will make a significant contribution to countries and enhance the decision-making process.

Benzer Tezler

  1. Recurrent neural network based approaches for electricity consumption forecasting

    Tekrarlayan sinir ağı tabanlı elektrik tüketim tahmini

    ALPER TOKGÖZ

    Yüksek Lisans

    İngilizce

    İngilizce

    2018

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. GÖZDE ÜNAL

  2. Farklı katı yakıt türlerinin üst ısıl değerlerinin çoklu lineer regresyon, karar ağacı, random forest ve yapay sinir ağları yöntemleriyle belirlenmesi

    Prediction of calorific value of solid fuel by multiple linear regression, decision tree, random forest and artificial neural network

    KAAN BÜYÜKKANBER

    Yüksek Lisans

    Türkçe

    Türkçe

    2022

    Kimya Mühendisliğiİstanbul Teknik Üniversitesi

    Kimya Mühendisliği Ana Bilim Dalı

    PROF. DR. HANZADE AÇMA

  3. Stratejik tarım ürünlerinde üretici fiyatlarının makine öğrenmesi algoritmaları ile tahmini

    Prediction of producer prices of strategic agricultural products with machine learning algorithms

    ZİYA ERDEM BİNAT

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    ZiraatGazi Üniversitesi

    İstatistik Ana Bilim Dalı

    PROF. DR. YAPRAK ARZU ÖZDEMİR

  4. Makine öğrenmesi algoritmaları kullanılarak 2040 yılına kadar Türkiye'nin enerji talep tahmini

    Turkey's energy demand forecast until 2040 using machine learning algorithms

    HAKAN ERDEMCİ

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    Elektrik ve Elektronik MühendisliğiBatman Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ÖMER ALİ KARAMAN

  5. Makine öğrenimi algoritmaları kullanılarak Erzurum ili için kirletici madde tahmini

    Pollutant prediction for Erzurum province using machine learning algorithms

    CEVAHİR DURAK

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    Meteorolojiİstanbul Teknik Üniversitesi

    Meteoroloji Mühendisliği Ana Bilim Dalı

    PROF. DR. HÜSEYİN TOROS