The imputation of missingness in cyclic and non-cyclic electromyography signaling data
Döngüsel ve döngüsüz elektromiyografi sinyali verilerinde eksikliklerin impütasyonu
- Tez No: 920453
- Danışmanlar: PROF. DR. VİLDA PURUTÇUOĞLU, DOÇ. DR. FİKRET ARI
- Tez Türü: Yüksek Lisans
- Konular: Biyoistatistik, Biyomühendislik, Biostatistics, Bioengineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2024
- Dil: İngilizce
- Üniversite: Orta Doğu Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Biyomedikal Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Biyomedikal Mühendisliğ ve Biyoenformatik Bilim Dalı
- Sayfa Sayısı: 123
Özet
Sağlık ve yaşam bilimlerinde çok boyutlu veri setleri genellikle zamanla değişen varyasyonları yansıtır, ancak sıklıkla eksiktir, bu da analizleri karmaşıklaştırır ve istatistiksel doğruluğu düşürür. Eksik veriyi ele almak için, makine öğrenimi algoritmaları (Random Forest (RF) ve K-En Yakın Komşu (K-NN) gibi) ve Spline ve Doğrusal enterpolasyon gibi parametrik olmayan yöntemler gibi pek çok imputasyon tekniği yaygın olarak kullanılmaktadır. Bu çalışma, zaman serisi biyomedikal bir veri seti olan Elektromiyografi (EMG) verisini incelemektedir ve dört tür EMG veri seti üzerinde on bir imputasyon yöntemini değerlendirmektedir. Dört yenilikçi imputasyon yaklaşımı—Normal-Rasyon (NR), Ağırlıklı-Normal-Rasyon (WNR), Beklenti-Maksimizasyonu (EM) ve Gibbs Örnekleme—sunulmakta ve her biri, EMG verilerinin özgül özelliklerini ele alarak doğruluk ve hesaplama verimliliği açısından değerlendirilmiştir. İki senaryo simüle edilmiştir: değişmemiş ve alt örneklenmiş EMG verisi, her biri farklı veri kaybı durumlarıyla dağılmış ve aralıklı kayıp desenlerine sahip. Karşılaştırmalı değerlendirme, EM yönteminin dikkate değer imputasyon doğruluğuna sahip olduğunu vurgulamaktadır ve Random Forest, EM algoritmasından sonra sağlam bir alternatif olarak ortaya çıkmaktadır. Ayrıca, NR ve WNR yöntemleri, doğruluğu artırırken, temel Ortalama ve Medyan imputasyon tekniklerine benzer hesaplama verimliliği göstermektedir. Ayrıca, döngüsel EMG verileri, tamamlama doğruluğunu artırmada göz ardı edilen ancak kritik bir faktör olarak ele alınmaktadır. Fourier dönüşümü, Spline ve Otoregresif modelleri kullanılarak, periyodik EMG verilerindeki frekanslar belirlenmiş ve EMG veri yapısını döngüsel bir forma dönüştürmek amacıyla iki yenilikçi yaklaşım önerilmiştir: Desen Tabanlı ve Sinüzoidal Tabanlı yaklaşımlar. Sonuçlar, Desen Tabanlı yaklaşımın doğruluğu artırdığını, Sinüzoidal Tabanlı yaklaşımın ise K-NN yöntemi için hesaplama verimliliği sağladığını göstermektedir.
Özet (Çeviri)
Multidimensional datasets in healthcare and life sciences often reflect temporal variations but are frequently incomplete, complicating analysis and reducing statistical accuracy. To address missing data, imputation techniques are widely used, with machine learning algorithms like Random-Forest (RF) and K-Nearest Neighbors (K-NN) and nonparametric methods such as Spline and Linear interpolation among the common approaches. This study examines Electromyography (EMG) data, a time-series biomedical dataset, by evaluating eleven imputation methods across four types of EMG datasets. We introduce four innovative imputation approaches—Normal-Ratio (NR), Weighted-Normal-Ratio (WNR), Expectation-Maximization (EM), and Gibbs Sampling—and assess each for accuracy and computational efficiency in handling the specific characteristics of EMG data. Two scenarios were simulated: unaltered and down-sampled EMG data, each with varied data loss states of scattered, and intermittent missingness patterns. The comparative assessment emphasizes the notable imputation accuracy of the EM method, with the Random Forest emerging as a robust alternative post-EM algorithm. Moreover, the NR and WNR methods demonstrate computational efficiency akin to fundamental Mean and Median imputation techniques, while improving accuracy. Additionally, we address the cyclic EMG data, an overlooked yet critical factor for enhancing imputation accuracy. Using Fourier transformation, Spline, and Autoregressive models, we identify frequencies in periodic EMG data and propose two novel approaches—Pattern-based and Sinusoidal-based—for modifying EMG data structure into cyclic form to improve imputation outcomes in K-NN and EM techniques. Results indicate that Pattern-based improves accuracy with EM and K-NN imputations, while Sinusoidal-based offers computational efficiency, particularly for K-NN, across random and partial missing patterns.
Benzer Tezler
- A simulation study on the comparison of methods for the analysis of longitudinal count data
Uzunlamasına kesikli veri analizi için yöntemlerin karşılaştırılması üzerine bir benzetim çalışması
GÜL İNAN
- Methods for handling missing data for observational studies with repeated measurements
Tekrarlayan ölçümlü gözlemsel araştırmalarda kayıp veri ile baş etme yöntemleri
OYA KALAYCIOĞLU
Doktora
İngilizce
2015
BiyoistatistikUniversity of London - University College LondonBiyoistatistik Ana Bilim Dalı
PROF. DR. RUMANA OMAR
- Non-uniformly sampled sequential data processing
Düzgün olmayan şekilde örneklenmiş sıralı verinin işlenmesi
SAFA ONUR ŞAHİN
Yüksek Lisans
İngilizce
2019
Elektrik ve Elektronik Mühendisliğiİhsan Doğramacı Bilkent ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
PROF. DR. SÜLEYMAN SERDAR KOZAT
- Gürültü giderici oto-kodlayıcı kullanarak eksik değerlerin tamamlanması
Completing the missing values using a denoising autoencoder
MAHA HUSSEIN ASGHAR ASGHAR
Yüksek Lisans
Türkçe
2020
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSelçuk ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ERSİN KAYA
- A deep learning architecture for missing metabolite concentration prediction
Eksik metabolit miktarı tahmini için bir derin öğrenme mimarisi
SADİ ÇELİK
Yüksek Lisans
İngilizce
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. ALİ ÇAKMAK