Öksürük ses kayıtları kullanılarak COVID-19 tahmini
Predicting COVID-19 using cough audio recordings
- Tez No: 710702
- Danışmanlar: DR. ÖĞR. ÜYESİ METE YAĞANOĞLU
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: COVID-19, Derin Sinir Ağı, Random Forest, MFCC, Spektrogram, Sıfır Geçiş Oranı, COVID-19, Deep Neural Network, Random Forest, MFCC, Spectrogram, Zero Crossing Rate
- Yıl: 2022
- Dil: Türkçe
- Üniversite: Atatürk Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 53
Özet
Amaç: Bu tez çalışmasının amacı, 2020 yılında tüm dünyayı etkileyen ve Dünya Sağlık Örgütü (WHO) tarafından pandemi olarak ilan edilen COVID-19 virüsünü erken teşhis ve düşük maliyette tespit eden yapay zekâ teknolojisinin bir alt dalı olan makine öğrenmesi tekniği geliştirilmiştir. Hastalığın hızlı bir şekilde tespit edilebilmesi için ön tarama araçlarının kullanımına olanak sağlanarak COVID-19 virüsünün tespitinde en önemli semptomlarından birisi olan öksürük sesleri kullanılarak Yapay Zekâ destekli bir çözüm yöntemi önerilmiştir. Yöntem: Bu tez çalışmasında kullanılan veriler, klinik doktorunun yönlendirmesi ile PCR (Polimeraz Zincir Reaksiyonu) testi yaptıran ve test sonucu pozitif veya negatif çıkan bireylerin öksürük ses verileri telefon ve sosyal medya üzerinden kaydedilerek incelenmesine dayanmaktadır. Deneklere ait PCR testleri klinik olarak doğrulanmış 750 örnekten öksürük ses verilerine dayanarak COVID-19 tahmini yapılmıştır. COVID-19 testi pozitif veya negatif olan kadın ve erkek bireylerden akıllı telefonlar aracılığıyla toplanan 750 örnekle bir veri kümesi oluşturulmuştur. Oluşturulan veri kümesi üzerinden en sık kullanılan; Mel Frekans Cepstral Katsayıları (MFCC), Spektrogram, Sıfır Geçiş Oranı, Spektral Azalma, Spektral Ağırlık Merkezi gibi sıklıkla kullanılan öznitelik çıkarma yöntemleri yanında Ton, Karekök Ortalama, Perdeleme gibi önceki çalışmalarda çok kullanılmamış ancak ses işlemede doğruluk oranını artıran öznitelik çıkarma yöntemi ile birlikte 7 adet öznitelik çıkarma yöntemi kullanılarak sesin öznitelikleri belirlenmiştir. Kullanılan her bir öznitelik veri kümesi üzerinde ayrı ayrı ele alınarak sonuçları incelenmiş doğruluk oranları bulunmuştur Daha sonra pozitif ve negatif bireylerin sınıflandırmasında, Destek Vektör Makinesi (SVM), Rastgele Orman (Random Forest), k-En Yakın Komşu (kNN), Naive Bayes ve Derin Sinir Ağı (DNN) yöntemleri kullanılarak en yüksek doğruluk veren yöntem belirlenmiştir. Bulgular: Tez çalışmasının sonucunda 375 deneğe ait COVID-19 sonucu pozitif ve 375 deneğe ait COVID-19 verisi negatif olmak üzere 750 deneğe ait test sonucunun öksürük sesi veri kümesi elde edilmiştir. Oluşturulan bu veri kümesi kullanılarak COVID-19 tahmini için sınıflandırma yöntemlerinden makine öğrenmesi yönteminin alt dalı olan klasik yöntem algoritması ile derin öğrenme yönteminin sonuçları alınmıştır. Sınıflandırma sonucunda doğruluk oranının veri kümesinin güvenilir olmasının ve öznitelik çıkarma yöntemlerinden sık kullanılan MFCC gibi yöntemlerin yanında Spektrogram, Sıfır Geçiş Oranı, Spektral Azalma, Spektral Ağırlık Merkezi, Ton, Karekök Ortalama gibi yöntemlerin kullanılması doğruluk oranını arttığı görülmüştür. Sınıflandırma yöntemlerinden derin öğrenme yöntemi olan Derin Sinir Ağları (DNN) modelinin, klasik yöntem algoritmalarından daha yüksek bir doğruluk verdiği görülmüştür. Sonuç: Pozitif ve negatif bireylerin sınıflandırmasında, Destek Vektör Makinesi %64.02, Rastgele Orman %96.97, k-En Yakın Komşu %65.98, Naive Bayes %83.68 ve Derin Sinir Ağı ile %98.48 doğruluk elde edilmiştir. Tüm bu sonuçlar baz alınarak öksürük sesi kullanılarak COVID-19 teşhisinin tahmini problemi için önerilen sınıflandırma problemlerinden derin öğrenme yöntemlerinin klasik yöntemlerden daha başarılı olduğu görülmüştür.
Özet (Çeviri)
Aim: The aim of this thesis study is to present the machine learning technique, which is a subbranch of artificial intelligence technology that detects the COVID-19 virus, which affected the whole world in 2020 and was declared a pandemic by the World Health Organization (WHO) in an early and low-cost way. To enable the use of fast, cost-effective and useful pre-screening tools to automatically detect the disease and to propose an Artificial Intelligence-supported solution method using cough sounds, one of the most important symptoms of the disease, COVID-19 prediction. Method: The data used in this thesis study are based on the examination of cough voice data of individuals who had a PCR (Polymerase Chain Reaction) test with the guidance of their clinic doctor and whose test result was positive or negative, by recording them over the phone and social media. COVID-19 prediction was made based on cough sound data from 750 samples whose PCR tests were clinically validated. A dataset was created with 750 samples collected via smartphones from male and female individuals with positive or negative COVID-19 test. The most frequently used data set; Along with the frequently used feature extraction methods such as Mel Frequency Cepstral Coefficients (MFCC), Spectrogram, Zero Crossing Ratio, Spectral Decay, Spectral Center of Gravity, along with the feature extraction method that has not been used much in previous studies such as Tone, Square Root Average, Screening, but increases the accuracy rate in sound processing. The features of the sound were determined by using the feature extraction method. Each attribute used was handled separately on the dataset, and the results were examined and their accuracy rates were found. Then, in the classification of positive and negative individuals, the method with the highest accuracy was determined by using Support Vector Machine (SVM), Random Forest, k-Nearest Neighbor (kNN), Naive Bayes and Deep Neural Network (DNN) methods. Findings: As a result of the thesis study, a 750 data set of cough sounds, consisting of 375 COVID-19 positive and 357 COVID-19 negative data, was obtained. Using this data set, the results of the classical method algorithms, which are sub-branches of the machine learning method, and the results of the deep learning method, one of the classification methods for COVID-19 prediction, were obtained. As a result of the classification, the accuracy rate of the data set is reliable and it increases the accuracy rate as well as frequently used methods such as Spectrogram, Zero Crossing Rate, Spectral Decay, Spectral Center of Gravity, Ton, Square Root Average (RMS), MFCC. It has been observed that the Deep Neural Networks (DNN) model, which is a deep learning method from the classification methods, gives higher accuracy than the classical method algorithms. Result: The accuracy in classification of positive and negative individuals was 64.02% with Support Vector Machine, 96.97% with Random Forest, 65.98% with k-Nearest Neighbor, 83.68% with Naive Bayes and 98.48% with Deep Neural Network. Based on all these results, it has been seen that deep learning methods, which is one of the proposed classification problems for the COVID-19 prediction problem using cough sound, are more successful than classical methods.
Benzer Tezler
- Ağır astımlı hastaların ses kalitesinin 'ses handikap endeksi' ve 'praat' ile değerlendirilmesi
Assessment of voice quality in severe ASTHMA using voicehandicap index and praat
DİLARA GAMZE AYDIN
Yüksek Lisans
Türkçe
2023
Göğüs Hastalıklarıİstanbul Medipol ÜniversitesiDil ve Konuşma Terapisi Ana Bilim Dalı
DR. ÖĞR. ÜYESİ TALAT BULUT
- Farklı işitme eşiklerinin ses parametreleri üzerindeki etkisinin objektif ve subjektif olarak değerlendirilmesi
Objective and Subjective Evaluation of the Effect of Different Hearing Thresholds on Sound Parameters
VELİ KIRBAÇ
Tıpta Uzmanlık
Türkçe
2023
Kulak Burun ve BoğazAydın Adnan Menderes ÜniversitesiKulak Burun Boğaz Ana Bilim Dalı
DOÇ. DR. MUSTAFA ŞAHİN
- Laringovideostroboskopik inceleme ve skorlama ile laringofarengeal reflü tanısında ampirik lansoprazol kullanımının etkinliği ve tedavi ile larengeal bulgulardaki değişimler
Effectiveness of the use of empi̇ri̇cal lansoprazole i̇n diagnosis of laryngopharyngeal reflux by laryngovi̇deostroboskopi̇k analysis and scoring system and changes in the fi̇ndi̇ngs of laryngopharyngeal reflux wi̇th treatment
AYŞEGÜL BATIOĞLU KARAALTIN
Tıpta Uzmanlık
Türkçe
2006
Kulak Burun ve BoğazSağlık BakanlığıKulak Burun Boğaz ve Baş-Boyun Cerrahisi Ana Bilim Dalı
PROF. DR. MEHMET KÜLEKÇİ
- Endotrakeal tüp kaf basınçlarının monitörize edilerek belirli aralıkta tutulmasının cerrahi sonrası öksürük, boğaz ağrısı, ses kısıklığı insidansı üzerine etkisi
The effect of monitoring endotracheal tube cuff pressures and keeping them within a certain range on the incidence of post-surgical cough, sore throat and hoarseness
KHEYRANA MAHMUDOVA
Tıpta Uzmanlık
Türkçe
2024
Anestezi ve ReanimasyonHacettepe ÜniversitesiAnesteziyoloji ve Reanimasyon Ana Bilim Dalı
DOÇ. DR. ALMILA GÜLSÜN PAMUK
DR. ÖĞR. ÜYESİ MURAT İZGİ
- Endotrakeal tüp kaf basıncının postoperatif boğaz ağrısı üzerine etkisi
The effect of endotracheal tube cuff pressure on postoperative sore throat
BUKET KAPÇAK
Tıpta Uzmanlık
Türkçe
2018
Anestezi ve ReanimasyonErciyes ÜniversitesiAnesteziyoloji ve Reanimasyon Ana Bilim Dalı
PROF. DR. ZEYNEP TOSUN