Classification of pediatric snoring episodes using deep convolutional neural networks
Pediyatrik horlama episodlarının derin evrişimsel sinir ağları ile sınıflandırılması
- Tez No: 512088
- Danışmanlar: PROF. MUSTAFA ERSEL KAMAŞAK
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2018
- Dil: İngilizce
- Üniversite: İstanbul Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
- Sayfa Sayısı: 66
Özet
Bu çalışmada, çocukların horlama episodlarının ortam ses kayıtlarından otomatik olarak tespit edilmesi için derin evrişimsel yapay sinir ağları tabanlı bir sistem geliştirilmiştir. Sistemin başarımını tespit etmek için basit horlama (BH) ve tıkanmaya bağlı uyku apnesi (TUA) rahatsızlığı bulunan 38 hastadan elde edilen veri seti kullanılmıştır. Horlama veya horlama-dışı olarak işaretlenen ses örneklerinin Mel spektrogramı elde edilerek işaretler 2 boyutlu hale getirilmiştir. Mel spektrogram uzayı üzerinde çalışacak bir derin evrişimsel yapay sinir ağı Adadelta yöntemi kullanılarak 1.200 örnek üzerinde eğitilmiştir. Sistem parametrelerini ayarlayarak başarımı artırmak için 300 örnekten oluşan doğrulama seti kullanılmıştır. Geliştirilen sistemin örnekleri horlama ve horlama-dışı olarak sınıflandırma doğruluğunun eğitim ve doğrulama setinde bulunmayan 300 örnek bulunan test setinde 20 deney ortalamasında %91 olduğu gözlemlenmiştir. Basit horlama (BH) ve tıkanmaya bağlı uyku apnesi (TUA), uykuda meydana gelebilen solunum bozukluklarındandır. BH ve TUA çocuklarda bilişsel becerilerde gerileme ve psikolojik rahatsızlıklara neden olabilmekte, belli koşullar altında daha da ciddi rahatsızlıklara yol açabilmektedir. Yapılan çalışmalarda TUA ve BH'nın çocuklarda görülme sıklığı %4,9-%17,1 olarak verilmektedir. TUA sendromu, uyku süresinde üst solunum yolunun tıkanmasıyla kan oksijen düzeyinde oluşan düşüşler ile karakterize edilmektedir. Solunumun 10 saniye veya üstünde %50 oranına düşmesi ve kandaki oksijen seviyesinin %3 azalması durumu hipoapne olarak adlandırılmaktadır. Solunumun 10 saniye ve üstünde tamamen durması durumu ise apne olarak adlandırılmaktadır. Apne-hipoapne endeksi (AHI), uyku apnesinin derecesini belirtmek için sıklıkla kullanılan bir ölçü birimidir. TUA sendromu teşhisi konulabilmesi için, yetişkinlerde AHI>=5, çocuklarda AHI>=1 eşik değerleri kullanılmaktadır . Yetişkinlerde horlama episodlarının otomatik tespiti için yapılmış çok sayıda çalışma bulunmaktadır. Ancak yetişkinler ve çocukların üst solunum yollarında bulunan farklılıklar nedeniyle yetişkinler üzerinde yapılan çalışmalar sonucu geliştirilen yöntemlerin çocuklar üzerinde yeterli başarım sağlayamadığı gözlemlenmiştir. Bu çalışmada, çocuklarda horlama episodlarının ortam ses kayıtlarından otomatik olarak tespiti için derin evrişimsel sinir ağları kullanılarak bir sistem tasarlanması amaçlanmıştır. Derin evrişimsel sinir ağları, evrişimsel bileşenleri sayesinde dönüşümsel değişmezlik sağlayabilmesi sayesinde gerek uzamsal gerek frekans uzayında mevcut yöntemlere göre daha yüksek başarım vermektedir. Ses işaretlerinin sınıflandırması konusundaki bir çok güncel çalışmada da derin evrişimsel sinir ağları kullanılmıştır. TUA ve BH'nın çocuklarda tanı ve tedavi sürecinde izlenebilmesi için otomatik sistemlerin oluşturulması önemli görülmektedir. Bu çalışmada çocuk horlama episodlarının ortam ses kayıtlarından otomatik tespiti amacıyla bir sistem geliştirilmiştir. Çocukların fizyolojik yapısının yetişkinlerden farklı olması sebebiyle çocuk horlama sesleri de yetişkinlere göre farklı özellik göstermektedir. Bu nedenle, TUA ve BH rahatsızlığı bulunan çocuklardan Çavuşoğlu ve diğ. tarafından toplanmış çocuk horlama ses kayıtları kullanılmıştır. Bu çalışmada, Çavuşoğlu ve diğ. tarafından 38 çocuktan gerekli izinler alınarak toplanmış olan ses kayıtları kullanılmıştır. Bu çocuklardan 28'ine BH, 10'una ise TUA teşhisi uzmanlar tarafından konulmuştur. Kullanılan ses kayıtları, uzmanlar tarafından elle horlama veya horlama-dışı olarak işaretlenmiştir. Veri setine ön işleme uygulanırken verinin horlama ve horlama-dışı şeklinde iki sınıfa ayrılması, ses işaretlerinden sınıflandırılmaya hazır özniteliklerin elde edilmesi, bu özniteliklerin sınıflar ile birlikte eğitim, test, doğrulama setlerine bölünerek derin evrişimsel sinir ağı eğitim ve test yöntemine hazır hale getirilmesi amaçlanmıştır. Gözlem noktaları horlama ve diğer (nefes, konuşma, gürültü, öksürme) olarak ayrılmış, ayrılan gözlem noktaları 1 sn. ile sınırlanmıştır. Daha sonra bu gözlem noktalarının mel spektrogramları çıkarılarak iki boyutlu işaret haline getirilmiş ve veri seti oluşturulmuştur. Bu veri seti eğitim, doğrulama ve test setlerine ayrılmıştır. Toplam 1.800 örnekten 1.200 tanesi eğitim için, 300 tanesi doğrulama için ve 300 tanesi test için ayrılmıştır. Bu kümeler tamamıyla farklı örneklerden oluşturulmuştur. Ayrıca, aynı hastaya ait örneklerin farklı kümelere (eğitim, doğrulama ve test) bölünmemesine de dikkat edilmiştir. Mel frekans ölçeği, deneysel çalışmalar ile insanın birbirine eşit mesafede olarak algıladığı ses aralıkları olarak belirlenmiş ve standardize edilmiştir. Ses tanıma alanındaki derin sinir ağı uygulamalarında da kullanım alanı bulmaktadır. Bu çalışmada ses işaretlerinin mel frekans ölçeğine göre süzgeçlenmiş iki boyutlu mel spektrogramları librosa kütüphanesi kullanılarak elde edilmiş, bu spektrogramlar derin sinir ağlarının giriş katmanına iki boyutlu tensörler olarak doğrudan verilmiştir. Frekansı 8 kHz üstündeki sinyal bileşenleri, gürültüden kaynaklandığı varsayılarak göz ardı edilmiştir. Bu çalışma esnasında sınıflandırma için NVIDIA CUDA Toolkit, cuDNN, Tensorflow ve Keras yazılım katmanları bir araya getirilerek derin evrişimsel sinir ağı eğitimi için yüksek başarımlı bir deneme ortamı oluşturulmuştur. Çalışmada geliştirilen sistem, Intel i5 6. nesil işlemci ve NVIDIA GTX 1080 Ti OC Founders Edition ekran kartı bulunduran bir sistem üzerinde çalıştırılmıştır. Buna ek olarak dizüstü bilgisayar ve bulut ortamlarında test edilmiştir. Spektrogram görüntülerinin sınıflandırılmasında, ses işaretlerinin yapısı gereği kullanılan ağın dönüşümsel değişmezlik(translational invariance) özelliği önem kazanmaktadır. Derin evrişimsel sinir ağlarında evrişim ve enbüyük havuzlama yöntemleri bir arada kullanıldığında, ağın giriş işaretindeki dönüşümlerden bağımsız olarak öğrenme kabiliyeti artırılabilmektedir. Enbüyük havuzlama (EH) yönteminde, her katman bölmelere ayrılarak bu bölmelerdeki özniteliklerin en yüksek değerinin bir sonraki katmana aktarılmasıyla verinin özetinin oluşturulması, bu yolla dönüşümsel değişmezlik, eğitim hızı ve öznitelik öğrenimi yönünde fayda sağlanması amaçlanır. Bu çalışmada enbüyük havuzlama yöntemi kullanılarak gittikçe küçülen katmanlara sahip bir ağ topolojisi oluşturulmuştur. Derin evrişimsel sinir ağlarında karşılaşılan bir diğer problem ise iç ortak değişinti kayması (Internal covariate shift) olarak adlandırılan, katmanların aktivasyon dağılımlarının sürekli olarak değişmesi ve sonraki katmanların bu değişime uyum sürecinde eğitim süresinin uzamasıdır. Bu değişimi engellemek amacıyla önerilen iki yöntem, her veri topluluğu sonrasında aktivasyonların normalize edilmesini öngören toplu normalizasyon (TN) ve üstsel doğrusal birim (exponential linear unit -- ELU) aktivasyon fonksiyonu kullanımıdır. ELU aktivasyon fonksiyonunun sıklıkla kullanılan Düzeltilmiş doğrusal birim (rectfied linear unit -- RELU) aktivasyon fonksiyonuna olan üstünlüğü sıfırdan büyük değerlere birim fonksiyon olarak tepki vermesi sayesinde RELU gibi yok olan gradyan problemine çözüm sunabilmesi, ve bunun yanında RELU'nun sahip olduğu ortalama aktivasyonun artı yönde kayması probleminden yoksun olmasıdır. ELU'nun CIFAR veri setlerinde TN ve RELU'nun birlikte kullanıldığı sistemlerden daha yüksek başarım sağladığı gösterilmiştir. Bu çalışmada TN+ELU ve TN+RELU yapıları ele alındığında en yüksek başarımın TN+ELU kullanımında elde edildiği gözlemlenmiştir. Dışarıda bırakma (Dropout) yöntemi bir düzenlileştirme (Regularization) yöntemi olup, eğitim esnasında rastgele olarak seçilen bir grup sinirin eğitimin dışında bırakılması yoluyla aşırı öğrenmenin önüne geçmektedir. Bu çalışmada düzenlileştirme için dışarıda bırakma yöntemi kullanılmıştır. Adadelta, gradyan inişi (Gradient descent) yöntemine nazaran büyük bir işlem yükü getirmeden uyarlanır öğrenme hızı sağlayan bir eğitim yöntemidir. Bu çalışmada kullanılan derin evrişimsel sinir ağlarının GPU üzerinde eğitiminde Adadelta yöntemi kullanılmıştır. Literatür incelemesi ve yapılan denemeler sonucunda sırasıyla evrişimsel giriş katmanı, gittikçe küçülen, TN+RELU/ELU, MH ve DO kullanılan evrişimsel katmanlar ve tamamen bağlı bir son çıkış katmanı içeren bir topoloji oluşturulmuştur. Bu topolojinin nöron sayısı ve parametreleri doğrulama setindeki başarımı gözlenerek belirlenmiştir. Yapılan çalışmalarda başarım ölçütü horlama veya horlama-dışı olarak doğru şekilde sınıflandırılan ses örneği sayısının toplam ses örnekleği sayısına yüzdesel oranı olarak belirlenmiştir. Yapılan çalışmalar sonucunda horlamanın eğitilen derin evrişimsel sinir ağı tarafından diğer ses örneklerinden ayrılarak doğru tespit edilme oranı 20 deney ortalamasında %91 olarak gözlemlenmiştir. Farklı eğitimlerde alınan en yüksek başarım değerinin %93, hassasiyet ve çöküş değerlerinin 0.96 ve 0.09 olduğu gözlemlenmiştir. Bu çalışma kapsamında geliştirilen sistemin, aynı veri seti üzerinde daha önce çok katmanlı perseptron kullanılarak geliştirilen sisteme göre daha yüksek başarım sergilediği gözlemlenmiştir.
Özet (Çeviri)
Simple snoring and obstructive sleep apnea are health conditions that have psychological, physiological and social implications for children including depression, reduced cognitive ability, and hyperactive behavior. According to studies, the frequency of diagnosis of OSA and SS in children are given as 4.9%-17.1%. Obstructive sleep apnea is characterized by drops in blood oxygen level caused by blockage of the upper respiratory tract. A 50% drop in respiration for 10 seconds or more and a consequent 3% drop in blood oxygen level is defined as hypoapnea. Complete stopping of respiration for 10 seconds or more is defined as apnea. Apnea-Hypoapnea Index (AHI) is a commonly used unit for determining the severity of the apnea. For a diagnosis of OSA, an AHI greater than 5 for adults and an AHI greater than 1 for children are used as thresholds. Diagnosis of obstructive sleep apnea requires expensive and time-consuming measurements to be made in a sleep laboratory, hence the current approach is not feasible for screening at large scale. A low-cost system that is able to warn about signs of obstructive sleep apnea can provide a feasible alternative. In this work, a deep convolutional neural network is designed for automatic detection of snoring episodes of children from ambient audio data. In order to test the performance of the network, a dataset collected from 38 pediatric patients with simple snoring or obstructive sleep apnea. The ambient audio signal is converted to Mel spectrogram for the model to learn relationships between features in the frequency domain. The network is trained using Adadelta algorithm on 1.200 samples. In order to fine-tune the system parameters, a validation set of 300 samples is used. Finally, a test set of 300 samples was used observe the performance of the developed network. The samples in the training, validation, and test samples are all exclusive. The mean accuracy of the proposed system over 20 experiments is observed as 91% for snore and non-snore. The accuracy observed is higher than previous work on the same dataset.
Benzer Tezler
- Periyodik ateş aftöz stomatit farenjit adenit (PFAPA) sendromu tanısında kullanılan Marshall tanı kriterlerinin performansının değerlendirilmesi
Evaluation of the performance of Marshall diagnostic criteria used in the diagnosis of periodic fever aphthous stomatitis pharyngitis adenitis (PFAPA) syndrome
KORAY TAN
Tıpta Uzmanlık
Türkçe
2022
Çocuk Sağlığı ve HastalıklarıSağlık Bilimleri ÜniversitesiÇocuk Sağlığı ve Hastalıkları Ana Bilim Dalı
PROF. DR. BETÜL SÖZERİ
- Terapötik endoskopik tedavi gerektiren gastrointestinal sistem kanamalarının erken değerlendirilmesinde belirleyici kriterler
Determining criteria for the early evaluation of gastrointestinal system bleedings requesting therapeutic endoscopic therapy
ÖZGE GÜNAL
Tıpta Uzmanlık
Türkçe
2023
Çocuk Sağlığı ve HastalıklarıMarmara ÜniversitesiÇocuk Sağlığı ve Hastalıkları Ana Bilim Dalı
PROF. DR. ENGİN TUTAR
DOÇ. DR. BURCU VOLKAN
- Pediyatrik travma hastalarında bıg skor sınıflamasının mortalite ve morbiditeyi öngörmedeki başarısının değerlendirilmesi
Evaluation of the success of big score classification in prediction of mortality and morbidity in pediatric trauma patients
ESİN ALTINÖZ SÖNMEZ
Tıpta Uzmanlık
Türkçe
2023
Anestezi ve Reanimasyonİstanbul ÜniversitesiAnesteziyoloji ve Reanimasyon Ana Bilim Dalı
DOÇ. DR. AHMET KEMALETTİN KOLTKA
- Hemofili A, B ve von Willebrand hastalığı ile izlenen olguların demografik verilerinin ve eklem durumlarının belirlenmesi
Demographic analyses and joints status of patients with hemophilia A, B and von Willebrand disease
ŞEFİKA SELVİ
Tıpta Uzmanlık
Türkçe
2009
HematolojiOndokuz Mayıs ÜniversitesiÇocuk Sağlığı ve Hastalıkları Ana Bilim Dalı
DOÇ. DR. TUNÇ FIŞGIN
- Anorektal malformasyon nedeni ile ameliyat edilen hastaların kısa ve uzun dönem sonuçlarının değerlendirilmesi
Evaluation of short and long-term outcomes of patients operated for anorectal malformations
ERGÜN BAHADIRHAN KARKIN
Tıpta Uzmanlık
Türkçe
2023
Çocuk CerrahisiEskişehir Osmangazi ÜniversitesiÇocuk Cerrahisi Ana Bilim Dalı
DOÇ. DR. MEHMET SURHAN ARDA