Geri Dön

Sayma verilerinde regresyon modelleri ve regresyon ağaçları uygulaması

Application of regression models and regression trees on count datasets

  1. Tez No: 881064
  2. Yazar: MİNE FULYA GÜRSEL
  3. Danışmanlar: DOÇ. DR. HATİCE TÜL KÜBRA AKDUR
  4. Tez Türü: Yüksek Lisans
  5. Konular: İstatistik, Statistics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2024
  8. Dil: Türkçe
  9. Üniversite: Gazi Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: İstatistik Ana Bilim Dalı
  12. Bilim Dalı: Veri Bilimi Bilim Dalı
  13. Sayfa Sayısı: 83

Özet

Belirli bir zaman, alan veya hacim başına meydana gelen olayların sayımına bağlı olarak elde edilen veriler sayma verisi olarak tanımlanmaktadır. Regresyon modelleri de bağımlı değişken ile bağımsız değişkenler arasındaki ilişkiyi açıklamaktadır. Bu çalışmada sayıma dayalı verilerin bağımlı değişken olduğu regresyon modellerinden bazıları incelenmiştir. Buna ek olarak heterojen bir popülasyonu daha homojen alt popülasyonlara ayırabilen ağaç tabanlı yöntemlerden, düğüm modelinde Poisson regresyon yöntemini kullanan, CART, GUIDE ve MOB regresyon ağacı algoritmaları incelenmiştir. Algoritmaların değişken seçim yanlılığı, tip 1 hataları ve güçleri simülasyon çalışmaları ile karşılaştırılmıştır. Ayrıca 2017-2022 yılları Ankara ilinde gerçekleşen trafik kaza sayıları ve doktora öğrencileri makale sayıları veri setleri ile bu ağaç modellerinin uygulamaları yapılmıştır. Bu veri setlerinden yola çıkarak bir simülasyon çalışması daha gerçekleştirilmiş ve algoritmaların tahmin hataları karşılaştırılmıştır. Simülasyon çalışmaları sonucunda değişkenlerin yansız olarak seçme, tip 1 hata ve güç bakımından karşılaştırılan üç algoritma arasında en iyi sonuç GUIDE algoritması ile elde edilmiştir. CART algoritmasının tip 1 hatası, tahmin performansı ve gücü yüksek elde edilmiştir. MOB algoritmasının tip 1 hatası ve tahmin performansı iyi olmasına rağmen gücü düşük elde edilmiştir.

Özet (Çeviri)

Count data is defined as data obtained based on a count of events occurring per specific time, area, or volume. Regression models explain the relationship between dependent and independent variables. In this study, some of the regression models where count data was the dependent variable were examined. In addition, CART, GUIDE, and MOB regression tree algorithms, which utilize the Poisson regression method in the node model, among tree-based methods that can segment a heterogeneous population into more homogeneous subpopulations, were examined. Variable selection bias, type 1 error, and power of the algorithms were compared using simulation studies. These tree models were also applied to the data sets of traffic accident numbers in Ankara, which occurred between 2017 and 2022, and the number of articles written by PhD students. Based on these data sets, another simulation study was conducted, and the prediction errors of the algorithms were compared. As a result of the simulation studies, the best result among the three compared algorithms in terms of unbiased selection of variables, type 1 error, and power was obtained with the GUIDE algorithm. The CART algorithm's type 1 error prediction performance and power were high. Although the MOB algorithm's type 1 error and prediction performance were good, its power was low.

Benzer Tezler

  1. Logit türel dağılım modeli kalibrasyonu: İstanbul için bir değerlendirme

    Logit modal-split model calibration: An evaluation for İstanbul

    HİLMİ BERK ÇELİKOĞLU

    Yüksek Lisans

    Türkçe

    Türkçe

    2002

    İnşaat Mühendisliğiİstanbul Teknik Üniversitesi

    Ulaştırma Ana Bilim Dalı

    PROF. DR. HALUK GERÇEK

  2. Using machine learning techniques to enhance teaching and performance prediction of students with autism spectrum disorders

    Yapay öğrenme yöntemleri ile otizm spektrum bozukluğu olan öğrencilerin öğretiminin ve öğretim performansı tahmininin iyileştirilmesi

    AKRAM M.M. RADWAN

    Doktora

    İngilizce

    İngilizce

    2016

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. ZEHRA ÇATALTEPE

  3. Sınıflandırma ve regresyon ağaçları (CART) algoritması: Borsa İstanbul üzerine bir uygulama

    Classification and regression trees (CART) algorithm: An application on Borsa İstanbul

    YAĞIZ CAN BAYHAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2021

    EkonometriAtatürk Üniversitesi

    Ekonometri Ana Bilim Dalı

    PROF. DR. MEHMET SUPHİ ÖZÇOMAK

  4. Sales forecasting in fashion retail industry with classical and machine learning methods

    Moda perakendesi sektöründe klasik ve makine öğrenmesi metodları ile satış tahmini

    HANİFE IŞIK

    Yüksek Lisans

    İngilizce

    İngilizce

    2020

    Ekonomiİstanbul Teknik Üniversitesi

    Ekonomi Ana Bilim Dalı

    DOÇ. DR. TOLGA YURET

  5. Tasarım/yapım organizasyonları için proje gerçekleşme süresinin tahminine yönelik bir bütünleşik model önerisi

    An integrated duration estimation model for design/build organizations

    YELİZ SEZGİN

    Yüksek Lisans

    Türkçe

    Türkçe

    2003

    Mimarlıkİstanbul Teknik Üniversitesi

    Mimarlık Ana Bilim Dalı

    DOÇ. DR. ALAATTİN KANOĞLU