Application of classical and machine learning models on longitudinal data with binary response
İkı̇lı̇ yanıtlı boylamsal verı̇lerde klası̇k ve makı̇ne öğrenme modellerı̇nı̇n uygulanması
- Tez No: 830502
- Danışmanlar: PROF. DR. ÖZLEM İLK DAĞ
- Tez Türü: Yüksek Lisans
- Konular: Biyoistatistik, İstatistik, Biostatistics, Statistics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2023
- Dil: İngilizce
- Üniversite: Orta Doğu Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: İstatistik Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 140
Özet
Alzheimer hastalığı (AH), yaşlı bireylerde hem bireyleri hem de toplumu etkileyen önemli bir küresel sağlık sorunudur. Hastalığın belirtileri zaman içinde gözlemlenebilir, bu da veriyi uzunlamasına bir yapıya dönüştürür. Klasik istatistiksel modeller ve makine öğrenimi algoritmaları bu veri kümelerini analiz etmek için kullanılabilir. Bu çalışma iki bölümden oluşmaktadır. İlk olarak, demans durumunu etkileyen özellikleri bulmak ve modellerin performanslarını karşılaştırmak için gerçek bir veri kümesi kullanılmıştır. Ardından, gerçek veri kümesi temel alınarak farklı sayıda birim ve her bir birim için eşit sayıda zaman noktası içeren bir simülasyon çalışması yapılmış ve model performansları karşılaştırılmıştır. Klasik karma modeller, genişletilmiş versiyonları ve hibrid modeller Boruta, GEE, GLMM, HGLM, GLMMLasso, GPBoost, GLMMTree ve HRF her iki bölümde de kullanılmıştır. Sonuç olarak, GPBoost, demans durumunu iyi öğrenir ve sınıflandırır, ancak veri kümesindeki küçük örneklem boyutu nedeniyle aşırı uyum sorunu gözlemlenmiştir. Gerçek veri kümesi için yeni bir birim çalışmaya katıldığında demans durumunu tahmin etmede ağaç tabanlı algoritmalar etkilidir. Simülasyon çalışması için HGLM, GPBoost ve GLLMMLasso algoritmaları, örneklem büyüklüğü ve veri kümesinin dengesi ne olursa olsun daha iyi performansa sahiptir.
Özet (Çeviri)
Alzheimer's disease (AD) is a significant global health issue that affects both individuals and society for older adults. The symptoms of the disease can be observed over time, making the structure longitudinal. Classical statistical models and machine learning algorithms can be used to analyze these datasets. This study consists of two parts: First, a real dataset is used to find the features affecting dementia status and compare the performances of models. Secondly, a simulation study based on the real dataset with a different number of subjects and an equal number of time points for each subject is conducted to apply and compare the model performances. The classical mixed models, their extended versions, and hybrid models, Boruta, GEE, GLMM, HGLM, GLMMLasso, GPBoost, GLMMTree, and HRF are used for both parts. As a result, GPBoost learns and classifies the dementia status well but overfits due to the small sample size in the dataset, and tree-based algorithms are efficient in predicting the dementia status when a new subject enters the study for the real dataset. For the simulation study, all methods have similar results, but HGLM, GPBoost and GLMMLasso algorithms have better performances regardless of the sample size and balance of the dataset.
Benzer Tezler
- Olasılıksal sembolik motif tanıma
Probabilistic symbolic pattern recognition
OĞUZ AKBİLGİÇ
Doktora
Türkçe
2022
İstatistikMimar Sinan Güzel Sanatlar Üniversitesiİstatistik Ana Bilim Dalı
PROF. DR. EYLEM DENİZ HOWE
- Geleneksel makine öğrenmesi ve karışık etkili makine öğrenmesi model performanslarının benzetim çalışması ile değerlendirilmesi
Assessment of the performance of classic standard machine learning models and mixed effect machine learning models via simulation study
EBRU TURGAL
Doktora
Türkçe
2022
BiyoistatistikAnkara ÜniversitesiBiyoistatistik Ana Bilim Dalı
DOÇ. DR. BEYZA DOĞANAY ERDOĞAN
- Hemşirelerin işten ayrılma niyetlerini etkileyen faktörlerin makine öğrenmesi yaklaşımları ile değerlendirilmesi
Evaluation of the factors affecting nurses' intention to leave their job with machine learning approaches
İREM AKÇAY
Yüksek Lisans
Türkçe
2023
İstatistikYıldız Teknik Üniversitesiİstatistik Ana Bilim Dalı
DOÇ. DR. ÖYKÜM ESRA YİĞİT
- Sales forecasting in fashion retail industry with classical and machine learning methods
Moda perakendesi sektöründe klasik ve makine öğrenmesi metodları ile satış tahmini
HANİFE IŞIK
Yüksek Lisans
İngilizce
2020
Ekonomiİstanbul Teknik ÜniversitesiEkonomi Ana Bilim Dalı
DOÇ. DR. TOLGA YURET
- Patlatma kaynaklı yer sarsıntısı tahmininde uyarlamalı bulanık çıkarım sistemi (ANFIS), destek vektör makineleri (SVM) ve gauss süreç regresyonu (GPR) tekniklerinin kullanımı
Application of adaptive-network based fuzzy inference system (ANFIS), support vector machines (SVM) and gaussian process regression (GPR) techniques for prediction of blast-induced ground vibrations
YAŞAR AĞAN
Yüksek Lisans
Türkçe
2023
Maden Mühendisliği ve Madencilikİstanbul Teknik ÜniversitesiMaden Mühendisliği Ana Bilim Dalı
PROF. DR. TÜRKER HÜDAVERDİ