Geri Dön

Transfer öğrenme tabanlı aktif öğrenme metodu ile duygu analizi

Sentiment analysis with transfer learning-based active learning method

  1. Tez No: 676203
  2. Yazar: SEHER LORT TOSUN
  3. Danışmanlar: PROF. DR. OĞUZ FINDIK
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2021
  8. Dil: Türkçe
  9. Üniversite: Karabük Üniversitesi
  10. Enstitü: Lisansüstü Eğitim Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 69

Özet

Günümüzde insanların birbirleri ile etkileşim kurdukları, interaktif paylaşımlar yaptıkları internet tabanlı sosyal medya araçları popülerleşmiştir. Bu araçlar ile video, ses ya da metin içerikli paylaşımlar kolaylıkla yapılabilmektedir. Kullanıcılar bu araçlar sayesinde kişisel görüşlerini, kurum-nesnelere karşı tutumlarını sıklıkla paylaşmaktadır. Bu uygulamaların da yaygınlaşmasıyla Doğal Dil İşleme (DDİ) alt çalışmalarından biri olan Duygu Analizi (DA) önem kazanmıştır. DA bireylerin ya da toplumun kurum, nesne ya da olgular hakkındaki fikirlerinin çeşitli makine öğrenimi yaklaşımları ile ortaya çıkarılmasıdır. DA çalışmalarında duygu sınıfı belirlenmiş etiketli verilere ihtiyaç vardır. Ancak veri etiketlemek zaman ve maliyet gerektiren bir işlemdir. Bu problemi çözmek için Aktif Öğrenme (AÖ) ve Transfer Öğrenme (TÖ) gibi yaklaşımlar kullanılabilir. AÖ mevcuttaki az sayıdaki etiketli veriden faydalanılarak duygu analizi yapılan çalışmalarda kullanılan bir yaklaşımdır. TÖ bir kaynak domainden edinilen bilginin başka bir domain olan hedef domaininde kullanılması prensibine dayanır. Bu tez çalışmasında daha önce yürütülmüş çalışmalardan farklı olarak AÖ ve TÖ yaklaşımları birlikte kullanılarak hibrit bir modelle Türkçe metinlerde farklı domainler arası duygu analizi çalışması yapılmıştır. Böylece farklı domainler arasında temsil yeteneği yüksek az miktardaki etiketli veri transfer edilerek sınıflandırma yapılabilmiştir. Çalışmada film, kitap, mutfak, elektronik ve DVD olmak üzere beş farklı domain kullanılmıştır. Domainler kullanıcıların bu ürün grupları için yaptıkları yorumlardan oluşmaktadır. Çalışmada AÖ' nin sınıflandırma başarısının başlangıç kümesine oldukça bağlı olduğu görülmüştür. Hedef ve kaynak domainlerin birbirine benzer veri setler olması sınıflandırma başarısını artırır. Çalışmamızda da en yüksek sınıflandırma başarısı film yorumları veri seti kaynak domain iken kitap yorumları veri seti hedef domain olması durumunda görülmüştür. Bu iki domain arası duygu analizinde TÖ tabanlı AÖ yapıldığında ortalama %8 sınıflandırma başarısı artışı olmuştur. Sınıflandırma için Lojistik Regresyon, Destek Vektör Makinesi ve Yapay Sinir Ağları kullanılmış, başarı oranları kıyaslanmıştır. Domainler arası duygu analizi çalışması yapılırken TÖ tabanlı AÖ yaklaşımının ürettiği çıktılar ile başarılı sonuçlar elde edilmiştir.

Özet (Çeviri)

Today, internet-based social media tools, where people interact with each other and share interactively, have become popular. With these tools, it is possible to share video, audio or text content easily. Thanks to these tools, users often share their personal opinions and attitudes towards institutions-objects. With the spread of these applications, Sentiment Analysis (SA), one of the sub-studies of Natural Language Processing (NLP), has gained importance. SA is the revealing of the ideas of individuals or society about institutions, objects or phenomena with various machine learning approaches. In SA studies, labeled data with determined emotion class are needed. However, tagging data is a time- and cost-intensive process. Approaches such as Active Learning (AL) and Transfer Learning (TL) can be used to solve this problem. AL is an approach used in studies in which sentiment analysis is made by utilizing the limited number of labeled data available. TL is based on the principle that the information obtained from one source domain is used in another domain, the target domain. In this thesis study, different from the previous studies, AL and TL approaches were used together, and a hybrid model of sentiment analysis between different domains was conducted in Turkish texts. Thus, classification can be made by transferring a small amount of labeled data with high representativeness between different domains. Five different domains were used in the study: film, book, kitchen, electronics and DVD. Domains consist of comments made by users for these product groups. In the study, it was seen that the classification success of AL was highly dependent on the starting set. The fact that the target and source domains are similar data sets increases the success of classification. In our study, the highest classification success was seen when the movie reviews dataset was the source domain, while the book reviews dataset was the target domain. In the sentiment analysis between these two domains, there was an average of 8% increase in classification success when TL-based AL was performed. Logistic Regression, Support Vector Machine and Artificial Neural Networks were used for classification and success rates were compared. While conducting sentiment analysis between domains, successful results were obtained with the outputs produced by the TL-based AL approach.

Benzer Tezler

  1. Robust trajectory optimization of constrained re-entry flight via stochastic collocation based ensemble pseudospectral optimal control

    Stokastik kolokasyona dayalı ensemble pseudospectral optimal kontrol ile kısıtlı yeniden giriş uçuşunun gürbüz yörünge eniyilemesi

    AKAN SELİM

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Astronomi ve Uzay Bilimleriİstanbul Teknik Üniversitesi

    Uçak ve Uzay Mühendisliği Ana Bilim Dalı

    PROF. DR. İBRAHİM OZKOL

  2. Machine learning based design of gap waveguides

    Makine öğrenmesi tabanlı boşluk dalga kılavuzu tasarımı

    UĞUR ALKAŞI

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    PROF. DR. MEHMET ÇAYÖREN

  3. Active learning based human in the loop deep object detectionfor scalable data annotation

    Ölçeklenebilir veri etiketlenmesi için aktif öğrenme tabanlı insan katılımlı derin nesne tespiti sistemi

    ATABERK ARMAN KAYHAN

    Yüksek Lisans

    İngilizce

    İngilizce

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Uçak ve Uzay Mühendisliği Ana Bilim Dalı

    DOÇ. DR. NAZIM KEMAL ÜRE

  4. Sabit güçlü yüklere sahip doğru akım mikro şebekelerde öğrenme tabanlı gerilim regülasyonu

    Learning-based voltage regulation in direct current micro-grids with constant power loads

    MUSTAFA GÜNGÖR

    Doktora

    Türkçe

    Türkçe

    2024

    Elektrik ve Elektronik MühendisliğiDicle Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ MEHMET EMİN ASKER

  5. Uzaktan eğitimin internette uygulanmasında arayüz oluşturma

    A Shell system for the implementation of distance education on internet

    E. ŞEYDA KOCAMAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2002

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolEge Üniversitesi

    Uluslararası Bilgisayar Ana Bilim Dalı

    DOÇ. DR. BAHAR KARAOĞLAN