Geri Dön

The imputation of missingness in cyclic and non-cyclic electromyography signaling data

Döngüsel ve döngüsüz elektromiyografi sinyali verilerinde eksikliklerin impütasyonu

  1. Tez No: 920453
  2. Yazar: FATEMEH SARASIR
  3. Danışmanlar: PROF. DR. VİLDA PURUTÇUOĞLU, DOÇ. DR. FİKRET ARI
  4. Tez Türü: Yüksek Lisans
  5. Konular: Biyoistatistik, Biyomühendislik, Biostatistics, Bioengineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2024
  8. Dil: İngilizce
  9. Üniversite: Orta Doğu Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Biyomedikal Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Biyomedikal Mühendisliğ ve Biyoenformatik Bilim Dalı
  13. Sayfa Sayısı: 123

Özet

Sağlık ve yaşam bilimlerinde çok boyutlu veri setleri genellikle zamanla değişen varyasyonları yansıtır, ancak sıklıkla eksiktir, bu da analizleri karmaşıklaştırır ve istatistiksel doğruluğu düşürür. Eksik veriyi ele almak için, makine öğrenimi algoritmaları (Random Forest (RF) ve K-En Yakın Komşu (K-NN) gibi) ve Spline ve Doğrusal enterpolasyon gibi parametrik olmayan yöntemler gibi pek çok imputasyon tekniği yaygın olarak kullanılmaktadır. Bu çalışma, zaman serisi biyomedikal bir veri seti olan Elektromiyografi (EMG) verisini incelemektedir ve dört tür EMG veri seti üzerinde on bir imputasyon yöntemini değerlendirmektedir. Dört yenilikçi imputasyon yaklaşımı—Normal-Rasyon (NR), Ağırlıklı-Normal-Rasyon (WNR), Beklenti-Maksimizasyonu (EM) ve Gibbs Örnekleme—sunulmakta ve her biri, EMG verilerinin özgül özelliklerini ele alarak doğruluk ve hesaplama verimliliği açısından değerlendirilmiştir. İki senaryo simüle edilmiştir: değişmemiş ve alt örneklenmiş EMG verisi, her biri farklı veri kaybı durumlarıyla dağılmış ve aralıklı kayıp desenlerine sahip. Karşılaştırmalı değerlendirme, EM yönteminin dikkate değer imputasyon doğruluğuna sahip olduğunu vurgulamaktadır ve Random Forest, EM algoritmasından sonra sağlam bir alternatif olarak ortaya çıkmaktadır. Ayrıca, NR ve WNR yöntemleri, doğruluğu artırırken, temel Ortalama ve Medyan imputasyon tekniklerine benzer hesaplama verimliliği göstermektedir. Ayrıca, döngüsel EMG verileri, tamamlama doğruluğunu artırmada göz ardı edilen ancak kritik bir faktör olarak ele alınmaktadır. Fourier dönüşümü, Spline ve Otoregresif modelleri kullanılarak, periyodik EMG verilerindeki frekanslar belirlenmiş ve EMG veri yapısını döngüsel bir forma dönüştürmek amacıyla iki yenilikçi yaklaşım önerilmiştir: Desen Tabanlı ve Sinüzoidal Tabanlı yaklaşımlar. Sonuçlar, Desen Tabanlı yaklaşımın doğruluğu artırdığını, Sinüzoidal Tabanlı yaklaşımın ise K-NN yöntemi için hesaplama verimliliği sağladığını göstermektedir.

Özet (Çeviri)

Multidimensional datasets in healthcare and life sciences often reflect temporal variations but are frequently incomplete, complicating analysis and reducing statistical accuracy. To address missing data, imputation techniques are widely used, with machine learning algorithms like Random-Forest (RF) and K-Nearest Neighbors (K-NN) and nonparametric methods such as Spline and Linear interpolation among the common approaches. This study examines Electromyography (EMG) data, a time-series biomedical dataset, by evaluating eleven imputation methods across four types of EMG datasets. We introduce four innovative imputation approaches—Normal-Ratio (NR), Weighted-Normal-Ratio (WNR), Expectation-Maximization (EM), and Gibbs Sampling—and assess each for accuracy and computational efficiency in handling the specific characteristics of EMG data. Two scenarios were simulated: unaltered and down-sampled EMG data, each with varied data loss states of scattered, and intermittent missingness patterns. The comparative assessment emphasizes the notable imputation accuracy of the EM method, with the Random Forest emerging as a robust alternative post-EM algorithm. Moreover, the NR and WNR methods demonstrate computational efficiency akin to fundamental Mean and Median imputation techniques, while improving accuracy. Additionally, we address the cyclic EMG data, an overlooked yet critical factor for enhancing imputation accuracy. Using Fourier transformation, Spline, and Autoregressive models, we identify frequencies in periodic EMG data and propose two novel approaches—Pattern-based and Sinusoidal-based—for modifying EMG data structure into cyclic form to improve imputation outcomes in K-NN and EM techniques. Results indicate that Pattern-based improves accuracy with EM and K-NN imputations, while Sinusoidal-based offers computational efficiency, particularly for K-NN, across random and partial missing patterns.

Benzer Tezler

  1. A simulation study on the comparison of methods for the analysis of longitudinal count data

    Uzunlamasına kesikli veri analizi için yöntemlerin karşılaştırılması üzerine bir benzetim çalışması

    GÜL İNAN

    Yüksek Lisans

    İngilizce

    İngilizce

    2009

    İstatistikOrta Doğu Teknik Üniversitesi

    İstatistik Bölümü

    DR. ÖZLEM İLK

  2. Methods for handling missing data for observational studies with repeated measurements

    Tekrarlayan ölçümlü gözlemsel araştırmalarda kayıp veri ile baş etme yöntemleri

    OYA KALAYCIOĞLU

    Doktora

    İngilizce

    İngilizce

    2015

    BiyoistatistikUniversity of London - University College London

    Biyoistatistik Ana Bilim Dalı

    PROF. DR. RUMANA OMAR

  3. Non-uniformly sampled sequential data processing

    Düzgün olmayan şekilde örneklenmiş sıralı verinin işlenmesi

    SAFA ONUR ŞAHİN

    Yüksek Lisans

    İngilizce

    İngilizce

    2019

    Elektrik ve Elektronik Mühendisliğiİhsan Doğramacı Bilkent Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    PROF. DR. SÜLEYMAN SERDAR KOZAT

  4. Gürültü giderici oto-kodlayıcı kullanarak eksik değerlerin tamamlanması

    Completing the missing values using a denoising autoencoder

    MAHA HUSSEIN ASGHAR ASGHAR

    Yüksek Lisans

    Türkçe

    Türkçe

    2020

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSelçuk Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ERSİN KAYA

  5. A deep learning architecture for missing metabolite concentration prediction

    Eksik metabolit miktarı tahmini için bir derin öğrenme mimarisi

    SADİ ÇELİK

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ALİ ÇAKMAK