Geri Dön

Makine öğrenimine dayalı çoklu atama yöntemlerinin parametrik olmayan çoklu karşılaştırmalara uygulanması ve benzetim çalışması

Applying machine learning-based multiple imputation methods to nonparametric multiple comparisons and simulation study

  1. Tez No: 926406
  2. Yazar: TUNCAY YANARATEŞ
  3. Danışmanlar: PROF. DR. ERDEM KARABULUT
  4. Tez Türü: Doktora
  5. Konular: Biyoistatistik, Biostatistics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2025
  8. Dil: Türkçe
  9. Üniversite: Hacettepe Üniversitesi
  10. Enstitü: Sağlık Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Biyoistatistik Ana Bilim Dalı
  12. Bilim Dalı: Biyoistatistik Bilim Dalı
  13. Sayfa Sayısı: 57

Özet

Aynı bireyler üzerinde tekrarlanan ölçümlerin yapıldığı uzunlamasına veri (bağımlı örneklemler), bireyler arasındaki potansiyel farklılıkları ortadan kaldırır. Uzunlamasına veride eksik veriler tasarım gereği veya rastgele oluşabilir. Skillings-Mack testi, normal dağılım göstermeyen eksik gözlemlere sahip k-bağımlı örneklemler için Friedman testi yerine kullanılır. Gruplar arasında anlamlı bir fark varsa, parametrik olmayan çoklu karşılaştırmalar yapılması gerekir. Bu çalışmada, normal dağılım göstermeyen eksik veriye sahip k-bağımlı örneklemlerin parametrik olmayan çoklu karşılaştırmalarına dört yöntem uygulayarak yenilikçi bir yaklaşım önerilmektedir. Dört yöntem, makine öğrenmesine dayalı iki parametrik olmayan çoklu atama yöntemi, bir parametrik olmayan atama yöntemi (rastgele sıcak deste ataması) ve liste bazında silme yöntemidir. Dört yöntem iki eksik veri mekanizması altında karşılaştırılmaktadır. Benzetim çalışmasında farklı senaryolar uygulandıktan sonra, liste bazında silme yöntemi (tam gözlemlerin kullanımı yöntemi) diğer yöntemlerden güç bakımından daha düşük bulunmuştur. İki parametrik olmayan çoklu atama yöntemi, iyi kontrol edilen tip 1 hatası olan orta ve küçük örnek boyutları için diğer yöntemlerden güç bakımından daha üstündür. Bu nedenle, eksik gözlemlere sahip k-bağımlı örneklemlerin parametrik olmayan çoklu karşılaştırmaları için makine öğrenimine dayalı çoklu atama yöntemlerinin kullanılmasını öneriyoruz. Ayrıca, önerilen yaklaşım gerçek bir veri seti üzerinde de uygulanmıştır. Bu örnekte, önerilen çoklu atama yöntemleri, başlangıçta eksik gözlemlerin olmadığı gerçek veri setindeki sonuçlara yakın sonuçlar vermiştir.

Özet (Çeviri)

Longitudinal data, in which repeated measurements are made on the same subjects, eliminate potential differences among the subjects. In longitudinal data, missing data can occur by design or completely random. The Skillings-Mack test is used instead of the Friedman test for longitudinal data with missing observations that are non-normally distributed. Nonparametric multiple comparisons need to be performed if a significant difference exists among groups. In this study, we propose a new approach by applying four methods to nonparametric multiple comparisons of longitudinal data that are non-normally distributed. The four methods are two nonparametric multiple imputation methods based on machine learning, one nonparametric imputation method (random hot deck imputation), and the listwise deletion method. We assume two missing data mechanisms. After implementing different scenarios in a simulation study, the listwise deletion method is inferior to the other methods. The two nonparametric multiple imputation methods are superior to the other methods for moderate and small sample sizes with well-controlled type 1 error. Therefore, we propose the two multiple imputation methods for nonparametric multiple comparisons of longitudinal data with missing observations. Moreover, the proposed approach was also applied on a real data set. In this example, the proposed multiple imputation methods yielded results similar to those of the real dataset without missing observations at the beginning.

Benzer Tezler

  1. Derin öğrenme ve büyük veri analitiği yöntemleriKullanarak Covid-19 yayılımının ileriye dönük tahmini

    Forecasting the spread of covid-19 using deep learning and big data analytics methods

    CYLAS KIGANDA

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi Üniversitesi

    Bilgisayar Bilimleri Ana Bilim Dalı

    PROF. DR. MUHAMMET ALİ AKCAYOL

  2. Penetration rate optimization in heterogeneous formations with support vector machines method

    Destek vektör makinesi yöntemi ile heterojen formasyonlarda ilerleme hızı optimizasyonu

    KORHAN KOR

    Doktora

    İngilizce

    İngilizce

    2021

    Petrol ve Doğal Gaz Mühendisliğiİstanbul Teknik Üniversitesi

    Petrol ve Doğal Gaz Mühendisliği Ana Bilim Dalı

    DOÇ. DR. GÜRŞAT ALTUN

  3. Çoklu modelli üst veri yönetimi temelli anlamsal arama altyapısının geliştirilmesi

    Development of semantic search infrastructure based on polyglot metadata management

    TANER GÜREL

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolEge Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. MURAT OSMAN ÜNALIR

  4. Hybrid optimization of multiple intelligent recommendation engines for software development cycles

    Yazılım geliştirme döngüleri için çoklu akıllı öneri motorlarının hibrit optimizasyonu

    ALI JAAFAR MEERA AL-ARKAWAZI

    Yüksek Lisans

    İngilizce

    İngilizce

    2021

    Bilim ve TeknolojiAltınbaş Üniversitesi

    Bilgi Teknolojileri Ana Bilim Dalı

    YRD. DOÇ. DR. ABDULLAHI ABDU IBRAHIM

  5. Accelerating molecular docking using machine learning methods

    Kenetleme hesaplarının makine öğrenme metotları ile hızlandırılması

    ABDULSALAM YAZID BANDE

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Bilimleri Ana Bilim Dalı

    Assist. Prof. Dr. SEFER BADAY