Geri Dön

Çok dilli duygu analizi

Multilingual sentiment analysis

  1. Tez No: 849383
  2. Yazar: DİLEK DEMİR
  3. Danışmanlar: PROF. DR. OLÇAY ARSLAN
  4. Tez Türü: Yüksek Lisans
  5. Konular: İstatistik, Statistics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2024
  8. Dil: Türkçe
  9. Üniversite: Ankara Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: İstatistik Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 57

Özet

Duygu analizi, makine öğrenmesi ve doğal dil işleme tekniklerini kullanarak metinlerdeki duyguları ortaya çıkarmayı amaçlayan bir çalışma alanıdır. Sosyal medya paylaşımları, ürün ve hizmet yorumları, otel ve film yorumları, haber metinleri ve kitaplar duygu analizi için başlıca veri kaynaklarıdır. Sosyal medya başta olmak üzere sosyal platformlarda kullanıcı ve paylaşım sayıları hızla artmaktadır. Sosyal platformlara dünyanın her yerinden erişim imkanı olması sonucu ortaya çok dilli veri yığınları çıkmaktadır. Ürün, hizmet veya kişiler hakkında ifade edilen görüşleri analiz edip karar süreçlerine dahil etmek önemli avantajlar sağlamaktadır ancak kaynaklar ve geliştirilen yöntemler her dil için yeterli düzeyde bulunmamaktadır. Bununla başa çıkmak için çeşitli çok dilli duygu analizi sistemleri geliştirilmiştir. Bu tez çalışmasında çok dilli duygu analizi yapmak amacıyla sağlık, turizm, pazarlama ve eğitim alanlarında İngilizce, Almanca, Felemenkçe dillerindeki tüketici görüşlerini içeren MultiEmo veri seti kullanılmıştır. MultiEmo çok dilli duygu analizi görevleri için oluşturulmuş bir veri setidir. Tüketici görüşleri Türkçe diline çevrilerek veri setine dahil edilmiştir. Cümle düzeyinde temsil yapan ve önceden eğitilmiş bir derin öğrenme modeli olan çok dilli evrensel cümle kodlayıcı (MUSE) kullanılarak veri seti vektörler ile temsil edilmiştir. Daha sonra kosinüs benzerliği kullanılarak cümleler pozitif veya negatif olarak sınıflandırılmıştır. Bu yaklaşım ile her dil ve her domain için ayrı ayrı model geliştirmek yerine derin öğrenme yaklaşımları kullanılarak başarılı sonuçlar elde edildiği görülmüştür. Yapılan sınıflandırma sonucunda İngilizce dilinde 0.75, Türkçe dilinde 0.72 doğruluk oranı elde edilmiştir.

Özet (Çeviri)

Sentiment analysis is a field of study that aims to reveal emotions in texts using machine learning and natural language processing techniques. Social media posts, product and service reviews, hotel and movie reviews, news texts, and books are the main data sources for sentiment analysis. The number of users and shares is rapidly increasing on social platforms, especially social media. Multilingual data stacks emerge as a result of access to social platforms from all over the world. Analyzing the opinions expressed about products, services, or people and including them in decision-making processes provides significant advantages, but the resources and developed methods are not sufficient for every language. Various multilingual sentiment analysis systems have been developed to deal with this. In this thesis, the MultiEmo dataset, which contains consumer opinions in English, German and Dutch in the fields of health, tourism, marketing and education, was used to conduct multilingual sentiment analysis. MultiEmo is a dataset created for multilingual sentiment analysis tasks. Consumer opinions were translated into Turkish and included in the data set. The data set was represented with vectors using the multilingual universal sentence encoder (MUSE), which is a pre-trained deep learning model that represents at the sentence level. Sentences were then classified as positive or negative using cosine similarity. With this approach, it has been observed that successful results have been achieved by using deep learning approaches instead of developing separate models for each language and each domain. As a result of the classification, an accuracy rate of 0.75 in English and 0.72 in Turkish was obtained.

Benzer Tezler

  1. Unified framework for sentiment analysis in multiple languages

    Çoklu dilde duygu analizi için bütünleşik bir yazılım altyapısı

    ABDELRAHMAN TAHA ABDELTAWAB ABDELLATIF

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolFatih Sultan Mehmet Vakıf Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ SHAABAN A.I. SAHMOUD

    DR. ÖĞR. ÜYESİ ALİ NİZAM

  2. Laravel ı̇le yapay zekâ algorı̇tması kullanarak duygu analı̇zı̇ uygulamasını gelı̇ştı̇rme

    Developing sentiment analysis application using artificial intelligence algorithm with laravel

    HÜSEYİN DALYAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolMaltepe Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ÖNDER ŞAHİNASLAN

  3. A social media big data mining framework for detecting sentiments in multiple languages

    Çok dilde duygu tespiti için bir sosyal medya büyük veri madenciliği çerçevesi

    MUSTAFA COŞKUN

    Doktora

    İngilizce

    İngilizce

    2018

    İşletmeBoğaziçi Üniversitesi

    Yönetim Bilişim Sistemleri Ana Bilim Dalı

    PROF. DR. MELTEM SEBA ÖZTURAN

  4. Word polarity detection using a multilingual approach

    Çoklu dil yaklaşımı ile kelimelerin anlamsal yönelimini bulma

    CÜNEYD MURAD ÖZSERT

    Yüksek Lisans

    İngilizce

    İngilizce

    2012

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. ARZUCAN ÖZGÜR

  5. Sosyal medyada türkçe nefret söylemlerinin ve Covid-19 yorumlarının makine öğrenmesi, derin öğrenme ve bert teknikleri ile analizi

    Analysis of turkish hateful discourses and Covid-19 comments in social media with machine learning, deep learning and bert techniques

    HABİBE KARAYİĞİT

    Doktora

    Türkçe

    Türkçe

    2022

    Elektrik ve Elektronik MühendisliğiMersin Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    PROF. DR. ALİ AKDAĞLI

    DOÇ. DR. ÇİĞDEM ACI