Geri Dön

Application of classical and machine learning models on longitudinal data with binary response

İkı̇lı̇ yanıtlı boylamsal verı̇lerde klası̇k ve makı̇ne öğrenme modellerı̇nı̇n uygulanması

  1. Tez No: 830502
  2. Yazar: RÜMEYSA RANA ARSLAN
  3. Danışmanlar: PROF. DR. ÖZLEM İLK DAĞ
  4. Tez Türü: Yüksek Lisans
  5. Konular: Biyoistatistik, İstatistik, Biostatistics, Statistics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2023
  8. Dil: İngilizce
  9. Üniversite: Orta Doğu Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: İstatistik Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 140

Özet

Alzheimer hastalığı (AH), yaşlı bireylerde hem bireyleri hem de toplumu etkileyen önemli bir küresel sağlık sorunudur. Hastalığın belirtileri zaman içinde gözlemlenebilir, bu da veriyi uzunlamasına bir yapıya dönüştürür. Klasik istatistiksel modeller ve makine öğrenimi algoritmaları bu veri kümelerini analiz etmek için kullanılabilir. Bu çalışma iki bölümden oluşmaktadır. İlk olarak, demans durumunu etkileyen özellikleri bulmak ve modellerin performanslarını karşılaştırmak için gerçek bir veri kümesi kullanılmıştır. Ardından, gerçek veri kümesi temel alınarak farklı sayıda birim ve her bir birim için eşit sayıda zaman noktası içeren bir simülasyon çalışması yapılmış ve model performansları karşılaştırılmıştır. Klasik karma modeller, genişletilmiş versiyonları ve hibrid modeller Boruta, GEE, GLMM, HGLM, GLMMLasso, GPBoost, GLMMTree ve HRF her iki bölümde de kullanılmıştır. Sonuç olarak, GPBoost, demans durumunu iyi öğrenir ve sınıflandırır, ancak veri kümesindeki küçük örneklem boyutu nedeniyle aşırı uyum sorunu gözlemlenmiştir. Gerçek veri kümesi için yeni bir birim çalışmaya katıldığında demans durumunu tahmin etmede ağaç tabanlı algoritmalar etkilidir. Simülasyon çalışması için HGLM, GPBoost ve GLLMMLasso algoritmaları, örneklem büyüklüğü ve veri kümesinin dengesi ne olursa olsun daha iyi performansa sahiptir.

Özet (Çeviri)

Alzheimer's disease (AD) is a significant global health issue that affects both individuals and society for older adults. The symptoms of the disease can be observed over time, making the structure longitudinal. Classical statistical models and machine learning algorithms can be used to analyze these datasets. This study consists of two parts: First, a real dataset is used to find the features affecting dementia status and compare the performances of models. Secondly, a simulation study based on the real dataset with a different number of subjects and an equal number of time points for each subject is conducted to apply and compare the model performances. The classical mixed models, their extended versions, and hybrid models, Boruta, GEE, GLMM, HGLM, GLMMLasso, GPBoost, GLMMTree, and HRF are used for both parts. As a result, GPBoost learns and classifies the dementia status well but overfits due to the small sample size in the dataset, and tree-based algorithms are efficient in predicting the dementia status when a new subject enters the study for the real dataset. For the simulation study, all methods have similar results, but HGLM, GPBoost and GLMMLasso algorithms have better performances regardless of the sample size and balance of the dataset.

Benzer Tezler

  1. Olasılıksal sembolik motif tanıma

    Probabilistic symbolic pattern recognition

    OĞUZ AKBİLGİÇ

    Doktora

    Türkçe

    Türkçe

    2022

    İstatistikMimar Sinan Güzel Sanatlar Üniversitesi

    İstatistik Ana Bilim Dalı

    PROF. DR. EYLEM DENİZ HOWE

  2. Geleneksel makine öğrenmesi ve karışık etkili makine öğrenmesi model performanslarının benzetim çalışması ile değerlendirilmesi

    Assessment of the performance of classic standard machine learning models and mixed effect machine learning models via simulation study

    EBRU TURGAL

    Doktora

    Türkçe

    Türkçe

    2022

    BiyoistatistikAnkara Üniversitesi

    Biyoistatistik Ana Bilim Dalı

    DOÇ. DR. BEYZA DOĞANAY ERDOĞAN

  3. Hemşirelerin işten ayrılma niyetlerini etkileyen faktörlerin makine öğrenmesi yaklaşımları ile değerlendirilmesi

    Evaluation of the factors affecting nurses' intention to leave their job with machine learning approaches

    İREM AKÇAY

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    İstatistikYıldız Teknik Üniversitesi

    İstatistik Ana Bilim Dalı

    DOÇ. DR. ÖYKÜM ESRA YİĞİT

  4. Sales forecasting in fashion retail industry with classical and machine learning methods

    Moda perakendesi sektöründe klasik ve makine öğrenmesi metodları ile satış tahmini

    HANİFE IŞIK

    Yüksek Lisans

    İngilizce

    İngilizce

    2020

    Ekonomiİstanbul Teknik Üniversitesi

    Ekonomi Ana Bilim Dalı

    DOÇ. DR. TOLGA YURET

  5. Patlatma kaynaklı yer sarsıntısı tahmininde uyarlamalı bulanık çıkarım sistemi (ANFIS), destek vektör makineleri (SVM) ve gauss süreç regresyonu (GPR) tekniklerinin kullanımı

    Application of adaptive-network based fuzzy inference system (ANFIS), support vector machines (SVM) and gaussian process regression (GPR) techniques for prediction of blast-induced ground vibrations

    YAŞAR AĞAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    Maden Mühendisliği ve Madencilikİstanbul Teknik Üniversitesi

    Maden Mühendisliği Ana Bilim Dalı

    PROF. DR. TÜRKER HÜDAVERDİ