A comparative study of classification algorithms for sentiment analysis of COVID-19 vaccine opinions using machine learning
Makine öğrenmeyi kullanarak COVID-19 aşı görüşlerinin duyarlılık analizi için sınıflandırma algoritmalarının karşılaştırmalı bir çalışması
- Tez No: 843863
- Danışmanlar: DR. ÖĞR. ÜYESİ MESUT ÇEVİK
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Elektrik ve Elektronik Mühendisliği, Computer Engineering and Computer Science and Control, Electrical and Electronics Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2024
- Dil: İngilizce
- Üniversite: Altınbaş Üniversitesi
- Enstitü: Lisansüstü Eğitim Enstitüsü
- Ana Bilim Dalı: Elektrik ve Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 64
Özet
Metinsel verileri analiz etme ve bunları doğal dil işleme alanı içerisinde olumlu, olumsuz veya nötr duygulara göre sınıflandırma görevi çok yönlü bir girişimdir. Bu çalışmanın temel amacı, koronavirüs hastalığı ve aşılara ilişkin görüşleri sınıflandırmak için makine öğrenmesi algoritmalarını kullanmaktır. Bu çalışmada Rastgele Orman (RF), Gradient Boosting Classifier (GBC), Lojistik Regresyon (LR) ve Karar Ağacı (DT) olmak üzere dört algoritma kullanılmıştır. RF ve GBC algoritmaları %89'luk övgüye değer bir doğruluk oranı sergilerken, LR ve DT algoritmaları %87 gibi biraz daha düşük bir doğruluk oranı sağladı. Bu araştırmadan elde edilen bulgular, politika yapıcılara aşılama kampanyalarının başarılı bir şekilde yürütülmesini engelleyebilecek potansiyel engellerin etkili bir şekilde ele alınmasında değerli rehberlik
Özet (Çeviri)
The task of analyzing textual data and classifying them into positive, negative, or neutral emotions within the domain of natural language processing is a multifaceted undertaking. The primary objective of this study is to employ machine learning algorithms in order to classify opinions pertaining to the coronavirus disease and vaccines. In this study, four algorithms were employed, namely Random Forest (RF), Gradient Boosting Classifier (GBC), Logistic Regression (LR), and Decision Tree (DT). The RF and GBC algorithms demonstrated a commendable accuracy rate of 89%, while the LR and DT algorithms yielded a slightly lower accuracy rate of 87%. The findings derived from this research can provide valuable guidance to policymakers in effectively addressing potential barriers that may impede the successful execution of vaccination campaigns. The analysis of the Kaggle data, which encompasses a wide range of commentaries related to the pandemic and vaccines, underscores the urgent need for prompt measures to attain herd immunity against Covid-19. This imperative objective holds significant importance in effectively managing the transmission of the virus and mitigating its adverse consequences on the well-being of the general population. The task at hand necessitates the acknowledgment and resolution of public apprehensions, as well as the establishment of trust and assurance in the vaccination initiative. This study presents an analysis of the machine learning techniques employed and conducts a comparative evaluation of their significance. The forthcoming research endeavors to create an application that will be capable of categorizing sentiments and opinions pertaining to diseases and vaccines. It is imperative for governments and organizations to comprehend the obstacles linked to the worldwide COVID-19 vaccination endeavor in order to develop efficacious strategies. Nevertheless, it is crucial to acknowledge that the scope of the analysis was restricted to tweets written in the English language. This limitation may potentially undermine the credibility and generalizability of the findings pertaining to overall sentiment. Additional investigation could be conducted to examine more extensive Twitter datasets employing deep learning models in order to gain a deeper comprehension of the general public's attitudes towards COVID-19 vaccines.
Benzer Tezler
- Large-scale arabic sentiment corpus and lexicon building for concept-based sentiment analysis systems
Kavram-tabanlı duygu analizi sistemleri için büyük ölçekli arapça duygu derlemi ve sözlüğü oluşturulması
AHMED RAOOF NASSER NASSER
Doktora
İngilizce
2018
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHacettepe ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. HAYRİ SEVER
- Sentiment analysis in social media: A comparative study
Sosyal medyada duygu analizi : Karşılaştırmalı bir çalışma
YASMIN TESFALDET GEBREYESUS
Yüksek Lisans
İngilizce
2018
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAtılım ÜniversitesiYazılım Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. ZİYA KARAKAYA
PROF. DR. ALİ YAZICI
- Dengesiz veri kümeleri için yenilikçi bir hibrit yaklaşım: IQCM metodolojisi ve karşılaştırmalı performans analizi
An innovative hybrid approach for imbalanced datasets: IQCM methodology and comparative performance analysis
MUSTAFA YAVAŞ
Doktora
Türkçe
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolDoğuş ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ AYSUN GÜRAN
- Türkçe metinlerde farklı temsil modelleri ve öğrenme yöntemleri ile duygu analizi karşılaştırması
Comparison of sentiment analysis with different representation models and learning methods in Turkish texts
KADRİYE MARANGOZ
Yüksek Lisans
Türkçe
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBursa Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ MUSTAFA ÖZGÜR CİNGİZ
- A comparative study of deep learning techniques in concrete crack detection: Convolutional neural networks and logistic regression
Beton çatlağı tahminde derin öğrenme yöntemlerinin kıyaslamalı bir çalışması: Evrişimsel sinir ağları ve lojistik regresyon
AZHI YASSIN RASUL
Yüksek Lisans
İngilizce
2021
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Kültür ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
PROF. DR. FADİME YÜKSEKTEPE