Sosyal Ağlarda Duygu Analizi için Hibrit Bir Yöntem Geliştirilmesi
Development of a Hybrid Method for Sentiment Analysis in Social Networks
- Tez No: 811405
- Danışmanlar: DR. ÖĞR. ÜYESİ FATİH KAYAALP
- Tez Türü: Doktora
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2023
- Dil: Türkçe
- Üniversite: Düzce Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 128
Özet
Teknolojinin gelişmesi, insanların sosyal hayatlarında birçok alışkanlığının değişimine sebep olmuştur. Pandeminin de etkisiyle eğitim başta olmak üzere birçok alanda yüz yüze iletişim oldukça azalmıştır. İnsanlar, sosyalleşmek için sosyal medya ve web sitelerine hızlıca erişim sağlayabilecekleri mobil cihazlar ile vakit geçirir hale gelmişlerdir. Pandemi sona ermesine rağmen, insanlar sosyalleşmek için web sitelerini ve sosyal medya uygulamalarını hala yaygın olarak kullanmaya devam edilmektedirler. İnsanlar birlikte izledikleri film, gittikleri restoran gibi birçok deneyimleri hakkında fikirlerini anlık şekilde paylaşmaktadırlar. Bu durum sosyal medya ve web siteleri aracılığıyla sürekli bir veri paylaşımına sebep olmaktadır. Bu veri paylaşımı çok büyük boyutta veri toplanmasına sebep olmaktadır. Bu veriler, pazarlamadan, reklama kadar birçok kurumu yakından ilgilendirmektedir. Bu kurumlar kendileri veya sektörlerine yönelik paylaşılan verileri kullanmak amacıyla çalışmalar yapmaktadırlar. Gelişen yapay zeka teknolojileriyle, bu çalışmalar firmalara katma değer kazandırmaktadır. Bu değeri kazandıran çalışma alanlarından biri de yapay zekanın alt dalı olan doğal dil işleme görevlerinden duygu analizidir. Bu çalışmada, IMDB web sayfasından toplanan veri kümesinde duygu analizi görevine yönelik deneysel çalışmalar gerçekleştirilmiştir. IMDB veri kümesi üzerinde Word2Vec kelime gömme yöntemi sonrası altı adet BiGRU ve sonrasına iki Evrişim Sinir ağı ile MBiGRUMCONV olarak isimlendirilen yeni bir yöntem önerilmiştir. Önerilen bu yöntemin en iyi doğruluk performansını verdiği %80-%20 eğitim-test ve %10 doğrulama kümesinde test sonuçları; %90,59, doğrulama kümesi sonuçları %94,67'dir. Ayrıca önerilen modelin 3, 5 ve 10 kat çapraz geçerleme sonuçları da alınmıştır. En iyi sonuç, 5-kat çapraz geçerleme ayrımında %90,67 doğruluk değeri ile alınmıştır. Tüm sonuçlar bir arada değerlendirildiğinde önerilen yöntemin literatür çalışmalarına kıyasla rekabetçi bir performans sergilediği görülmüştür. Çalışma kapsamında TripAdvisor, Rotten Tomatoes ve Twitterdan toplanan açık kaynak olarak sunulan veri kümeleri üzerinde farklı metin temsili yöntemleri sonrasında çeşitli derin öğrenme, makine öğrenmesi ve topluluk öğrenme yöntemleriyle modeller oluşturulmuştur. Yüksek model başarımı almak için gelecek çalışmalarda, hibrit model oluştururken; ön eğitimli BERT türevleri ile metin temsili çıkarıldıktan sonra çift yönlü sinir ağlarının kullanılması önerilmektedir.
Özet (Çeviri)
The development of technology has led to changes in many habits in people's social lives. As a result of the pandemic, face-to-face communication has decreased significantly in many areas, especially education. People have started to spend time with mobile devices where they can quickly access social media and websites to socialize. Even though the pandemic is over, people are still widely using websites and social media applications to socialize. People instantly share their opinions about their experiences such as the movie they watched together or the restaurant they went to. This leads to constant data sharing through social media and websites. This data sharing leads to massive data collection. This data is of great interest to many organizations from marketing to advertising. These organizations are working to use the data shared for themselves or their sectors. With the developing artificial intelligence technologies, these studies bring added value to companies. One of the areas of study that adds this value is sentiment analysis, one of the natural language processing tasks, which is a sub-branch of artificial intelligence. In this study, experimental studies were carried out for sentiment analysis task on the dataset collected from IMDB web page. A new method called MBiGRUMCONV was proposed on the IMDB dataset with six BiGRUs and two Convolutional Neural Networks after the Word2Vec word embedding method. The best accuracy performance of this proposed method is 90.59% for the 80%-20% training-testing and 10% validation set, and 94.67% for the validation set. The proposed model was also cross-validation 3, 5, and 10-fold. The 5-fold cross-validation resulted in an accuracy of 90.67%. When all the results are evaluated together, it is seen that the proposed method performs competitively compared to the literature studies. Within the scope of the study, models were created with various deep learning, machine learning and ensemble learning methods after different text representation methods on open-source datasets collected from TripAdvisor, Rotten Tomatoes and Twitter. In order to achieve high model performance, in future studies, it is recommended to use bidirectional neural networks after text representation extraction with pre-trained BERT derivatives when building hybrid models.
Benzer Tezler
- Güncel hesapsal zekâ algoritmalarıyla büyük sosyal veri analizi
Big social data analysis with computational intelligent algorithms
ÜMİT CAN
Doktora
Türkçe
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolFırat ÜniversitesiYazılım Mühendisliği Ana Bilim Dalı
PROF. DR. BİLAL ALATAŞ
- Sosyal örümcek algoritmasıyla sosyal ağlarda duygu analizi
Sentiment analysis in social networks with social spider optimization algorithm
VAHTETTİN CEM BAYDOĞAN
Yüksek Lisans
Türkçe
2018
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolFırat ÜniversitesiYazılım Mühendisliği Ana Bilim Dalı
DOÇ. DR. BİLAL ALATAŞ
- Derin öğrenme yöntemiyle çevrimiçi sosyal ağlarda duygu analizi ve metin özetleme
Deep learning based sentiment analysis and text summarization in social networks
EMRE DOĞAN
Yüksek Lisans
Türkçe
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolFırat ÜniversitesiEkobilişim Ana Bilim Dalı
DR. ÖĞR. ÜYESİ BUKET KAYA
- Konu tabanlı sosyal topluluklar için etkili kullanıcı ağırlıklandırılmış duygu analizi yöntemi
Influential user weighted sentiment analysis on topic based microblogging community
ALPASLAN BURAK ELİAÇIK
Doktora
Türkçe
2018
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. TAKUHİ NADİA ERDOĞAN
- Etkinlik yönetimi ve sosyal ağ verileri ile etkinlik analizi Rock'n Coke Festivali'nin Twitter verileri ile duygu analizi örneği
Event management and event analysis with social networking data example of sentiment analysis with Rock'n Coke Festival's Twitter data
GİZEM ŞAVLUKBAŞ
Yüksek Lisans
Türkçe
2019
İletişim BilimleriAnadolu Üniversitesiİşletme Ana Bilim Dalı
PROF. DR. GÜLFİDAN BARIŞ