Derin öğrenme ve kelime gömme modelleri kullanarak parkinson hastalığının analizi
Parkinson disease analysis with deep learning and word embedding models
- Tez No: 627219
- Danışmanlar: DR. ÖĞR. ÜYESİ ZEYNEP HİLAL KİLİMCİ
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2019
- Dil: Türkçe
- Üniversite: Doğuş Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
- Sayfa Sayısı: 57
Özet
Amaç Parkinson hastalığı, hastanın yaşam kalitesini etkileyen, önemli sosyal ve ekonomik etkileri olan ve semptomların aşamalı görünümü nedeniyle erken teşhis edilmesi güç olan yaygın bir nörolojik hastalıktır. Parkinson hastalığının Twitter gibi sosyal medya platformlarında tartışılması, hastaların Parkinson hastalığının hem tanı hem de tedavi aşamasında birbirleriyle iletişim kurduğu bir platform sağlar. Bu çalışmanın amacı, derin öğrenme ve kelime gömme modelleri kullanarak insanların Parkinson hastalığı ile ilgili duygusallık analizlerini değerlendirmek ve karşılaştırmaktır. Bildiğimiz kadarıyla, Parkinson hastalığını sosyal medyadan kelime gömme modelleri ve derin öğrenme algoritmaları kullanarak analiz etmek için yapılan ilk çalışmadır. Materyaller ve yöntemler Parkinson hastalığı ile ilgili tweetler, Twitter sayfalarındaki (“ParkinsonsCure”,“Parkinson”,“ParkinsonsTreatment, ParkinsonDiagnosis”) anahtar kelimeleri ile hesaplarını arayarak elde edildi. Parkinson hastalığına ilişkin tüm tweetler, 01.01.2009- 09.01.2019 tarihleri arasında Python programlama dilinde yazdığımız Selenium Crawler kullanılarak toplandı. Bu çalışmada Word2Vec, GloVe ve FastText, tweetleri anlamsal, bağlamsal ve sözdizimi açısından zenginleştirmek amacıyla kelime gömme modelleri olarak kullanılmıştır. Evrişimli Sinir Ağları (CNN'ler), Tekrarlayan Sinir Ağları (RNN'ler) ve Uzun Kısa Süreli Bellek Ağları (LSTM'ler) sınıflandırma görevi için uygulanılmıştır. Deneysel Sonuçlar Bu çalışmada, kelime gömme modelleri ve derin öğrenme algoritmaları kullanılarak Parkinson hastalığı hakkında kullanıcı yorumlarının duygularını analiz etmek için kapsamlı deneyler yapılmıştır. Doğruluk, her modelin sınıflandırma performansını ve çalışmamızın katkısını göstermek için deneylerde bir değerlendirme ölçütü olarak kullanılır. Ön işleme yöntemlerinin kelime gömme modelleri üzerindeki etkisi %50 eğitim setinde incelendiğinde, RH ve RU yöntemlerinin kombinasyonunun en iyi doğruluk performansını gösterdiği görülmektedir. Word2Vec kelime gömme modellerinde ön işleme yöntemleriyle %89,34 doğrulukla en iyi sonuçlara sahiptir. Benzer şekilde, ön işleme yöntemlerinin derin öğrenme algoritmaları üzerindeki etkisi incelendiğinde, RH ve RU konsolidasyonunun diğer ön işleme yöntemlerinden daha iyi sonuçlar verdiği görülmektedir. LSTM, RU + RH yöntemleriyle harmanlanarak %93,63 doğruluk performansına sahip en iyi performans gösteren sınıflandırma algoritmasıdır. Sonuçlar Bu çalışma, hastaların gereksinimlerini anlamak için kelime gömme modelleri ve derin öğrenme algoritmalarını kullanma etkinliğini ve duygularını analiz ederek tedavi sürecine değerli bir katkı sağladığını göstermektedir.
Özet (Çeviri)
Objective Parkinson's disease is a common neurodegenerative neurological disorder, which affects the patient's quality of life, has significant social and economic effects, and is difficult to diagnose early due to the gradual appearance of symptoms. Examining the discussion of Parkinson's disease in social media platforms such as Twitter provides a platform where patients communicate each other in both diagnosis and treatment stage of the Parkinson's disease. The purpose of this work is to evaluate and compare the sentiment analysis of people about Parkinson's disease by using deep learning and word embedding models. To the best of our knowledge, this is the very first study to analyze Parkinson's disease from social media by using word embedding models and deep learning algorithms. Materials and Methods Tweets about Parkinson's disease are obtained by searching accounts on Twitter pages with keywords (“ParkinsonsCure”,“Parkinson”,“ParkinsonsTreatment, ParkinsonDiagnosis”). All tweets related to Parkinson's disease are collected from 01.01.2009 to 09.01.2019 using Selenium Crawler, which we write in Python programming language. In this study, Word2Vec, GloVe, and FastText are employed as word embedding models for the purpose of enriching tweets in terms of semantic, context, and syntax. Convolutional Neural Networks (CNNs), Recurrent Neural Networks (RNNs), and Long Short-Term Memory Networks (LSTMs) are implemented for the classification task. Results In this study, extensive experiments are conducted to analyze the emotions of user comments about Parkinson's disease using word embedding models and deep learning algorithms. Accuracy is used as an evaluation metric in the experiments to demonstrate the classification performance of each model and the contribution of our study. When the effect of preprocessing methods on word embedding models is examined at 50% training set, it is observed that the combination of RH and RU methods shows the best accuracy performance. Word2Vec has the best results with 89.34% accuracy with preprocessing methods in word embedding models. Likewise, when the effect of preprocessing methods on deep learning algorithms is analyzed, it is observed that the consolidation of RH and RU gives better results than other preprocessing methods. LSTM is the best performing classification algorithm with 93.63% accuracy performance by blending with the RU + RH methods. Conclusions This study demonstrates the efficiency of using word embedding models and deep learning algorithms to understand the needs of patients' and provide a valuable contribution to the treatment process by analyzing sentiments of them.
Benzer Tezler
- Yeni nesil derin bağlamsallaştırılmış kelime gösterimleri ve derin öğrenme modelleriyle finansal haberler kullanarak borsa tahminlemesi
Stock generation estimation using financial news with new generation deep contextualized word display and deep learning models
DERYA OTHAN
Yüksek Lisans
Türkçe
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolDoğuş ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ZEYNEP HİLAL KİLİMCİ
- Twıtter üzerinden müşteri duygularının analiz edilerektürkiye'deki telekom operatörleri ile ilgili müşterimemnuniyetinin değerlendirilmesi
Evaluation of customer satisfaction about telecom operators in turkey by analyzing sentiments of customer through twitter
DOĞUKAN KÜNDÜM
Yüksek Lisans
Türkçe
2021
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolDoğuş ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. MİTAT UYSAL
DR. ÖĞR. ÜYESİ ZEYNEP HİLAL KİLİMCİ
- Doğal dil işleme tekniklerini ve derin öğrenme algoritmalarını kullanarak sosyal ağlarda spam tespiti
Using natural language processing techniques and deep learning algorithms for detecting spam on social networks
REZAN BAKIR
Doktora
Türkçe
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKırıkkale ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. HASAN ERBAY
- Fake news detection via automated deep learning
Başlık çevirisi yok
YASİR ABDULKAREEM JAMAL JAMAL
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAltınbaş ÜniversitesiBilişim Teknolojileri Ana Bilim Dalı
PROF. DR. OSMAN NURİ UÇAN
- Çevrimiçi sosyal ağlarda rahatsız edici davranış tespiti ve azaltma stratejileri
Misbehaviour detection and mitigation strategies in online social networks
SEMA ŞAHİN
Yüksek Lisans
Türkçe
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolMarmara ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. AYŞE BERNA ALTINEL GİRGİN