Derin öğrenmede öznitelik seçim yaklaşımları kullanılarak metin verilerinden covıd-19 aşı karşıtlığı tespiti
Covid-19 anti-vaccination detection from text data using feature selection approaches in deep learning
- Tez No: 861458
- Danışmanlar: DR. ÖĞR. ÜYESİ ERDAL ÖZBAY
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2024
- Dil: Türkçe
- Üniversite: Fırat Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Yazılım Bilim Dalı
- Sayfa Sayısı: 78
Özet
COVID-19 pandemisi, dünya genelinde sağlık, ekonomi ve toplumsal yaşamı derinden etkileyen bir krize dönüşmüştür. Bu kriz sırasında aşı karşıtlığı, salgının kontrolü ve aşılama kampanyalarının etkinliği açısından önemli bir engel oluşturmaktadır. Bu çalışmada, derin öğrenme ve öznitelik seçimi yaklaşımlarının birleşimi kullanılarak COVID-19 aşı karşıtlığının metin verilerinden tespiti amaçlanmıştır. Önerilen yöntem, derin öğrenme modeli ile öznitelik seçimi tekniklerinin entegrasyonunu içermekte ve metin verilerindeki önemli öznitelikleri belirleyerek aşı karşıtlığını tanımlamaktadır. Bu çalışma, derin öğrenme modellerinin etkinliğini değerlendirme üzerine de yoğunlaşmaktadır. Tezin hipotezleri arasında, derin öğrenme modellerinin öznitelik seçim yaklaşımlarıyla entegre bir şekilde kullanılmasıyla COVID-19 aşı karşıtlığını doğru şekilde sınıflandırabileceği ve tanımlayabileceği varsayılmaktadır. Kullanılan örneklem, GitHub üzerinden genel erişime açık sunulan ve sosyal medya platformlarından Twitter API kullanılarak oluşturulan COVID-19 ile ilgili ingilizce tweetlerden oluşmaktadır. Örneklem büyüklüğü, geniş bir veri yelpazesini temsil etmek amacıyla 10.000'den fazla metin öğesini içermektedir. Yöntem olarak, öznitelik seçimi için farklı yöntemler, derin öğrenme modeli ve optimizasyon algoritmaları kullanılmıştır. Önerilen yöntem, derin öğrenme modeli ile öznitelik seçimi tekniklerinin entegrasyonunu içermekte ve metin verilerindeki önemli öznitelikleri belirleyerek aşı karşıtlığını tanımlamaktadır. Öznitelik çıkarımı için TF-IDF ve N-gram yöntemleri entegre kullanılmıştır. Veri kümesi iki etiketten oluşmaktadır. Etiketler dengeli olmadığından veri kümesinin dengelenmesi için SMOTE yöntemi uygulanmıştır. Ardından Ki-kare ile öznitelik seçimi gerçekleştirilmiştir. Sınıflandırma işlemi için Derin Öğrenme mimarilerinden LSTM (Uzun Kısa Süreli Bellek) kullanılmıştır. Sınıflandırma analizlerinde veri kümesi, %80 eğitim ve %20 test verisi olarak ayrılmıştır. Önerilen model ile elde edilen sonuçlar, %99.23 doğruluk değeri ve %99.21 F1-skor değeri olmuştur. Bu sonuçlar, COVID-19 aşı karşıtlığının metin verileri üzerinde etkili bir şekilde tespit edilmesi için önerilen yöntemin başarılı bir şekilde kullanılabileceğini göstermektedir. Çalışmanın sonuçları, sağlık politikalarının ve kamuoyu bilgilendirme stratejilerinin geliştirilmesine yönelik değerli bilgiler sunabilmektedir. Çalışmanın bulguları, derin öğrenme ve öznitelik seçimi yöntemlerinin, COVID-19 aşı karşıtlığını tespit etmede etkili bir şekilde kullanılabileceğini göstermektedir. Bu araştırma, sağlık otoritelerine, aşılama kampanyalarını planlarken ve halk sağlığı müdahalelerini tasarlarken, aşı karşıtlığını belirlemede yeni ve güçlü bir araç sunmaktadır.
Özet (Çeviri)
The COVID-19 pandemic has turned into a crisis that deeply affects health, economy and social life around the world. During this crisis, anti-vaccination poses a significant obstacle to the control of the epidemic and the effectiveness of vaccination campaigns. In this study, it was aimed to detect COVID-19 vaccine opposition from text data by using a combination of deep learning and feature selection approaches. The proposed method involves the integration of deep learning model and feature selection techniques and identifies anti-vaccine sentiment by identifying important features in text data. This study also focuses on evaluating the effectiveness of deep learning models. Among the hypotheses of the thesis, it is assumed that deep learning models can accurately classify and identify COVID-19 anti-vaccination by using them in an integrated manner with feature selection approaches. The sample used consists of English tweets about COVID-19, which are publicly available on GitHub and created using the Twitter API from social media platforms. The sample size included more than 10,000 text items to represent a wide range of data. As a method, different methods, deep learning model and optimization algorithms were used for feature selection. The proposed method involves the integration of deep learning model and feature selection techniques and identifies anti-vaccine sentiment by identifying important features in text data. TF-IDF and N-gram methods were integrated for feature extraction. The dataset consists of two labels. Since the labels are not balanced, the SMOTE method was applied to balance the dataset. Then, feature selection was performed using Chi-square. LSTM (Long Short Term Memory), one of the Deep Learning architectures, was used for the classification process. In classification analyses, the dataset is divided into 80% training and 20% test data. The results obtained with the proposed model were 99.23% accuracy value and 99.21% F1-score value. These results show that the proposed method can be successfully used to effectively detect COVID-19 vaccine opposition on text data. The results of the study can provide valuable information for the development of health policies and public information strategies. The findings of the study show that deep learning and feature selection methods can be used effectively to detect COVID-19 vaccine opposition. This research offers health authorities a powerful new tool to identify anti-vaccine sentiment when planning vaccination campaigns and designing public health interventions.
Benzer Tezler
- Fake news classification using machine learning and deep learning approaches
Makine öğrenimi ve derin öğrenme yaklaşımlarını kullanarak sahte haber sınıflandırması
SAJA ABDULHALEEM MAHMOOD AL-OBAIDI
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ TUBA ÇAĞLIKANTAR
- Sentiment analysis model proposal with deep learning techniques on big data: Portfolio selection with the help of industry indicators
Büyük veri üzerinde derin öğrenme teknikleri ile duygu analizi model önerisi: Sektör göstergeleri yardımıyla portföy seçimi
MAHMUT SAMİ SİVRİ
Doktora
İngilizce
2023
Endüstri ve Endüstri Mühendisliğiİstanbul Teknik ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
PROF. DR. ALP ÜSTÜNDAĞ
- Türkçe için sahte haber tespit modelinin oluşturulması
A fake news detection model for Turkish language
UĞUR MERTOĞLU
Doktora
Türkçe
2020
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHacettepe ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ BURKAY GENÇ
PROF. DR. HAYRİ SEVER
- Borsa tahmininde derin öğrenme tabanlı yenilikçi modeller
Deep learning-based innovative models for stock market prediction
ZİNNET DUYGU AKŞEHİR
Doktora
Türkçe
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOndokuz Mayıs ÜniversitesiHesaplamalı Bilimler Ana Bilim Dalı
PROF. DR. ERDAL KILIÇ
- Yanık görüntülerinin çok değişkenli istatistiksel yöntemler ve derin öğrenme yaklaşımları ile analizi
Analysis of burn images by multivariate statistical methods and deep learning approaches
ERDİNÇ KARAKULLUKÇU
Doktora
Türkçe
2020
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKaradeniz Teknik Üniversitesiİstatistik ve Bilgisayar Bilimleri Ana Bilim Dalı
DR. ÖĞR. ÜYESİ UĞUR ŞEVİK