The imputation of missingness in cyclic and non-cyclic electromyography signaling data

Döngüsel ve döngüsüz elektromiyografi sinyali verilerinde eksikliklerin impütasyonu

PDF İndir

Tez No: 920453
Yazar: FATEMEH SARASIR
Danışmanlar: PROF. DR. VİLDA PURUTÇUOĞLU, DOÇ. DR. FİKRET ARI
Tez Türü: Yüksek Lisans
Konular: Biyoistatistik, Biyomühendislik, Biostatistics, Bioengineering
Anahtar Kelimeler: Belirtilmemiş.
Yıl: 2024
Dil: İngilizce
Üniversite: Orta Doğu Teknik Üniversitesi
Enstitü: Fen Bilimleri Enstitüsü
Ana Bilim Dalı: Biyomedikal Mühendisliği Ana Bilim Dalı
Bilim Dalı: Biyomedikal Mühendisliğ ve Biyoenformatik Bilim Dalı
Sayfa Sayısı: 123

Özet

Sağlık ve yaşam bilimlerinde çok boyutlu veri setleri genellikle zamanla değişen varyasyonları yansıtır, ancak sıklıkla eksiktir, bu da analizleri karmaşıklaştırır ve istatistiksel doğruluğu düşürür. Eksik veriyi ele almak için, makine öğrenimi algoritmaları (Random Forest (RF) ve K-En Yakın Komşu (K-NN) gibi) ve Spline ve Doğrusal enterpolasyon gibi parametrik olmayan yöntemler gibi pek çok imputasyon tekniği yaygın olarak kullanılmaktadır. Bu çalışma, zaman serisi biyomedikal bir veri seti olan Elektromiyografi (EMG) verisini incelemektedir ve dört tür EMG veri seti üzerinde on bir imputasyon yöntemini değerlendirmektedir. Dört yenilikçi imputasyon yaklaşımı—Normal-Rasyon (NR), Ağırlıklı-Normal-Rasyon (WNR), Beklenti-Maksimizasyonu (EM) ve Gibbs Örnekleme—sunulmakta ve her biri, EMG verilerinin özgül özelliklerini ele alarak doğruluk ve hesaplama verimliliği açısından değerlendirilmiştir. İki senaryo simüle edilmiştir: değişmemiş ve alt örneklenmiş EMG verisi, her biri farklı veri kaybı durumlarıyla dağılmış ve aralıklı kayıp desenlerine sahip. Karşılaştırmalı değerlendirme, EM yönteminin dikkate değer imputasyon doğruluğuna sahip olduğunu vurgulamaktadır ve Random Forest, EM algoritmasından sonra sağlam bir alternatif olarak ortaya çıkmaktadır. Ayrıca, NR ve WNR yöntemleri, doğruluğu artırırken, temel Ortalama ve Medyan imputasyon tekniklerine benzer hesaplama verimliliği göstermektedir. Ayrıca, döngüsel EMG verileri, tamamlama doğruluğunu artırmada göz ardı edilen ancak kritik bir faktör olarak ele alınmaktadır. Fourier dönüşümü, Spline ve Otoregresif modelleri kullanılarak, periyodik EMG verilerindeki frekanslar belirlenmiş ve EMG veri yapısını döngüsel bir forma dönüştürmek amacıyla iki yenilikçi yaklaşım önerilmiştir: Desen Tabanlı ve Sinüzoidal Tabanlı yaklaşımlar. Sonuçlar, Desen Tabanlı yaklaşımın doğruluğu artırdığını, Sinüzoidal Tabanlı yaklaşımın ise K-NN yöntemi için hesaplama verimliliği sağladığını göstermektedir.

Özet (Çeviri)

Multidimensional datasets in healthcare and life sciences often reflect temporal variations but are frequently incomplete, complicating analysis and reducing statistical accuracy. To address missing data, imputation techniques are widely used, with machine learning algorithms like Random-Forest (RF) and K-Nearest Neighbors (K-NN) and nonparametric methods such as Spline and Linear interpolation among the common approaches. This study examines Electromyography (EMG) data, a time-series biomedical dataset, by evaluating eleven imputation methods across four types of EMG datasets. We introduce four innovative imputation approaches—Normal-Ratio (NR), Weighted-Normal-Ratio (WNR), Expectation-Maximization (EM), and Gibbs Sampling—and assess each for accuracy and computational efficiency in handling the specific characteristics of EMG data. Two scenarios were simulated: unaltered and down-sampled EMG data, each with varied data loss states of scattered, and intermittent missingness patterns. The comparative assessment emphasizes the notable imputation accuracy of the EM method, with the Random Forest emerging as a robust alternative post-EM algorithm. Moreover, the NR and WNR methods demonstrate computational efficiency akin to fundamental Mean and Median imputation techniques, while improving accuracy. Additionally, we address the cyclic EMG data, an overlooked yet critical factor for enhancing imputation accuracy. Using Fourier transformation, Spline, and Autoregressive models, we identify frequencies in periodic EMG data and propose two novel approaches—Pattern-based and Sinusoidal-based—for modifying EMG data structure into cyclic form to improve imputation outcomes in K-NN and EM techniques. Results indicate that Pattern-based improves accuracy with EM and K-NN imputations, while Sinusoidal-based offers computational efficiency, particularly for K-NN, across random and partial missing patterns.

Benzer Tezler

Tez No
255294
A simulation study on the comparison of methods for the analysis of longitudinal count data
Uzunlamasına kesikli veri analizi için yöntemlerin karşılaştırılması üzerine bir benzetim çalışması
GÜL İNAN
Yüksek Lisans
İngilizce
2009
İstatistik Orta Doğu Teknik Üniversitesi
İstatistik Bölümü
DR. ÖZLEM İLK
Tez No
809903
Methods for handling missing data for observational studies with repeated measurements
Tekrarlayan ölçümlü gözlemsel araştırmalarda kayıp veri ile baş etme yöntemleri
OYA KALAYCIOĞLU
Doktora
İngilizce
2015
Biyoistatistik University of London - University College London
Biyoistatistik Ana Bilim Dalı
PROF. DR. RUMANA OMAR
Tez No
582470
Non-uniformly sampled sequential data processing
Düzgün olmayan şekilde örneklenmiş sıralı verinin işlenmesi
SAFA ONUR ŞAHİN
Yüksek Lisans
İngilizce
2019
Elektrik ve Elektronik Mühendisliği İhsan Doğramacı Bilkent Üniversitesi
Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
PROF. DR. SÜLEYMAN SERDAR KOZAT
Tez No
650042
Gürültü giderici oto-kodlayıcı kullanarak eksik değerlerin tamamlanması
Completing the missing values using a denoising autoencoder
MAHA HUSSEIN ASGHAR ASGHAR
Yüksek Lisans
Türkçe
2020
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol Selçuk Üniversitesi
Bilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ERSİN KAYA
Tez No
887071
A deep learning architecture for missing metabolite concentration prediction
Eksik metabolit miktarı tahmini için bir derin öğrenme mimarisi
SADİ ÇELİK
Yüksek Lisans
İngilizce
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol İstanbul Teknik Üniversitesi
Bilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. ALİ ÇAKMAK

Geri Dön