Sayma verilerinde regresyon modelleri ve regresyon ağaçları uygulaması
Application of regression models and regression trees on count datasets
- Tez No: 881064
- Danışmanlar: DOÇ. DR. HATİCE TÜL KÜBRA AKDUR
- Tez Türü: Yüksek Lisans
- Konular: İstatistik, Statistics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2024
- Dil: Türkçe
- Üniversite: Gazi Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: İstatistik Ana Bilim Dalı
- Bilim Dalı: Veri Bilimi Bilim Dalı
- Sayfa Sayısı: 83
Özet
Belirli bir zaman, alan veya hacim başına meydana gelen olayların sayımına bağlı olarak elde edilen veriler sayma verisi olarak tanımlanmaktadır. Regresyon modelleri de bağımlı değişken ile bağımsız değişkenler arasındaki ilişkiyi açıklamaktadır. Bu çalışmada sayıma dayalı verilerin bağımlı değişken olduğu regresyon modellerinden bazıları incelenmiştir. Buna ek olarak heterojen bir popülasyonu daha homojen alt popülasyonlara ayırabilen ağaç tabanlı yöntemlerden, düğüm modelinde Poisson regresyon yöntemini kullanan, CART, GUIDE ve MOB regresyon ağacı algoritmaları incelenmiştir. Algoritmaların değişken seçim yanlılığı, tip 1 hataları ve güçleri simülasyon çalışmaları ile karşılaştırılmıştır. Ayrıca 2017-2022 yılları Ankara ilinde gerçekleşen trafik kaza sayıları ve doktora öğrencileri makale sayıları veri setleri ile bu ağaç modellerinin uygulamaları yapılmıştır. Bu veri setlerinden yola çıkarak bir simülasyon çalışması daha gerçekleştirilmiş ve algoritmaların tahmin hataları karşılaştırılmıştır. Simülasyon çalışmaları sonucunda değişkenlerin yansız olarak seçme, tip 1 hata ve güç bakımından karşılaştırılan üç algoritma arasında en iyi sonuç GUIDE algoritması ile elde edilmiştir. CART algoritmasının tip 1 hatası, tahmin performansı ve gücü yüksek elde edilmiştir. MOB algoritmasının tip 1 hatası ve tahmin performansı iyi olmasına rağmen gücü düşük elde edilmiştir.
Özet (Çeviri)
Count data is defined as data obtained based on a count of events occurring per specific time, area, or volume. Regression models explain the relationship between dependent and independent variables. In this study, some of the regression models where count data was the dependent variable were examined. In addition, CART, GUIDE, and MOB regression tree algorithms, which utilize the Poisson regression method in the node model, among tree-based methods that can segment a heterogeneous population into more homogeneous subpopulations, were examined. Variable selection bias, type 1 error, and power of the algorithms were compared using simulation studies. These tree models were also applied to the data sets of traffic accident numbers in Ankara, which occurred between 2017 and 2022, and the number of articles written by PhD students. Based on these data sets, another simulation study was conducted, and the prediction errors of the algorithms were compared. As a result of the simulation studies, the best result among the three compared algorithms in terms of unbiased selection of variables, type 1 error, and power was obtained with the GUIDE algorithm. The CART algorithm's type 1 error prediction performance and power were high. Although the MOB algorithm's type 1 error and prediction performance were good, its power was low.
Benzer Tezler
- Logit türel dağılım modeli kalibrasyonu: İstanbul için bir değerlendirme
Logit modal-split model calibration: An evaluation for İstanbul
HİLMİ BERK ÇELİKOĞLU
Yüksek Lisans
Türkçe
2002
İnşaat Mühendisliğiİstanbul Teknik ÜniversitesiUlaştırma Ana Bilim Dalı
PROF. DR. HALUK GERÇEK
- Using machine learning techniques to enhance teaching and performance prediction of students with autism spectrum disorders
Yapay öğrenme yöntemleri ile otizm spektrum bozukluğu olan öğrencilerin öğretiminin ve öğretim performansı tahmininin iyileştirilmesi
AKRAM M.M. RADWAN
Doktora
İngilizce
2016
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. ZEHRA ÇATALTEPE
- Sınıflandırma ve regresyon ağaçları (CART) algoritması: Borsa İstanbul üzerine bir uygulama
Classification and regression trees (CART) algorithm: An application on Borsa İstanbul
YAĞIZ CAN BAYHAN
Yüksek Lisans
Türkçe
2021
EkonometriAtatürk ÜniversitesiEkonometri Ana Bilim Dalı
PROF. DR. MEHMET SUPHİ ÖZÇOMAK
- Sales forecasting in fashion retail industry with classical and machine learning methods
Moda perakendesi sektöründe klasik ve makine öğrenmesi metodları ile satış tahmini
HANİFE IŞIK
Yüksek Lisans
İngilizce
2020
Ekonomiİstanbul Teknik ÜniversitesiEkonomi Ana Bilim Dalı
DOÇ. DR. TOLGA YURET
- Tasarım/yapım organizasyonları için proje gerçekleşme süresinin tahminine yönelik bir bütünleşik model önerisi
An integrated duration estimation model for design/build organizations
YELİZ SEZGİN
Yüksek Lisans
Türkçe
2003
Mimarlıkİstanbul Teknik ÜniversitesiMimarlık Ana Bilim Dalı
DOÇ. DR. ALAATTİN KANOĞLU