Transfer öğrenme tabanlı aktif öğrenme metodu ile duygu analizi
Sentiment analysis with transfer learning-based active learning method
- Tez No: 676203
- Danışmanlar: PROF. DR. OĞUZ FINDIK
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2021
- Dil: Türkçe
- Üniversite: Karabük Üniversitesi
- Enstitü: Lisansüstü Eğitim Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 69
Özet
Günümüzde insanların birbirleri ile etkileşim kurdukları, interaktif paylaşımlar yaptıkları internet tabanlı sosyal medya araçları popülerleşmiştir. Bu araçlar ile video, ses ya da metin içerikli paylaşımlar kolaylıkla yapılabilmektedir. Kullanıcılar bu araçlar sayesinde kişisel görüşlerini, kurum-nesnelere karşı tutumlarını sıklıkla paylaşmaktadır. Bu uygulamaların da yaygınlaşmasıyla Doğal Dil İşleme (DDİ) alt çalışmalarından biri olan Duygu Analizi (DA) önem kazanmıştır. DA bireylerin ya da toplumun kurum, nesne ya da olgular hakkındaki fikirlerinin çeşitli makine öğrenimi yaklaşımları ile ortaya çıkarılmasıdır. DA çalışmalarında duygu sınıfı belirlenmiş etiketli verilere ihtiyaç vardır. Ancak veri etiketlemek zaman ve maliyet gerektiren bir işlemdir. Bu problemi çözmek için Aktif Öğrenme (AÖ) ve Transfer Öğrenme (TÖ) gibi yaklaşımlar kullanılabilir. AÖ mevcuttaki az sayıdaki etiketli veriden faydalanılarak duygu analizi yapılan çalışmalarda kullanılan bir yaklaşımdır. TÖ bir kaynak domainden edinilen bilginin başka bir domain olan hedef domaininde kullanılması prensibine dayanır. Bu tez çalışmasında daha önce yürütülmüş çalışmalardan farklı olarak AÖ ve TÖ yaklaşımları birlikte kullanılarak hibrit bir modelle Türkçe metinlerde farklı domainler arası duygu analizi çalışması yapılmıştır. Böylece farklı domainler arasında temsil yeteneği yüksek az miktardaki etiketli veri transfer edilerek sınıflandırma yapılabilmiştir. Çalışmada film, kitap, mutfak, elektronik ve DVD olmak üzere beş farklı domain kullanılmıştır. Domainler kullanıcıların bu ürün grupları için yaptıkları yorumlardan oluşmaktadır. Çalışmada AÖ' nin sınıflandırma başarısının başlangıç kümesine oldukça bağlı olduğu görülmüştür. Hedef ve kaynak domainlerin birbirine benzer veri setler olması sınıflandırma başarısını artırır. Çalışmamızda da en yüksek sınıflandırma başarısı film yorumları veri seti kaynak domain iken kitap yorumları veri seti hedef domain olması durumunda görülmüştür. Bu iki domain arası duygu analizinde TÖ tabanlı AÖ yapıldığında ortalama %8 sınıflandırma başarısı artışı olmuştur. Sınıflandırma için Lojistik Regresyon, Destek Vektör Makinesi ve Yapay Sinir Ağları kullanılmış, başarı oranları kıyaslanmıştır. Domainler arası duygu analizi çalışması yapılırken TÖ tabanlı AÖ yaklaşımının ürettiği çıktılar ile başarılı sonuçlar elde edilmiştir.
Özet (Çeviri)
Today, internet-based social media tools, where people interact with each other and share interactively, have become popular. With these tools, it is possible to share video, audio or text content easily. Thanks to these tools, users often share their personal opinions and attitudes towards institutions-objects. With the spread of these applications, Sentiment Analysis (SA), one of the sub-studies of Natural Language Processing (NLP), has gained importance. SA is the revealing of the ideas of individuals or society about institutions, objects or phenomena with various machine learning approaches. In SA studies, labeled data with determined emotion class are needed. However, tagging data is a time- and cost-intensive process. Approaches such as Active Learning (AL) and Transfer Learning (TL) can be used to solve this problem. AL is an approach used in studies in which sentiment analysis is made by utilizing the limited number of labeled data available. TL is based on the principle that the information obtained from one source domain is used in another domain, the target domain. In this thesis study, different from the previous studies, AL and TL approaches were used together, and a hybrid model of sentiment analysis between different domains was conducted in Turkish texts. Thus, classification can be made by transferring a small amount of labeled data with high representativeness between different domains. Five different domains were used in the study: film, book, kitchen, electronics and DVD. Domains consist of comments made by users for these product groups. In the study, it was seen that the classification success of AL was highly dependent on the starting set. The fact that the target and source domains are similar data sets increases the success of classification. In our study, the highest classification success was seen when the movie reviews dataset was the source domain, while the book reviews dataset was the target domain. In the sentiment analysis between these two domains, there was an average of 8% increase in classification success when TL-based AL was performed. Logistic Regression, Support Vector Machine and Artificial Neural Networks were used for classification and success rates were compared. While conducting sentiment analysis between domains, successful results were obtained with the outputs produced by the TL-based AL approach.
Benzer Tezler
- Robust trajectory optimization of constrained re-entry flight via stochastic collocation based ensemble pseudospectral optimal control
Stokastik kolokasyona dayalı ensemble pseudospectral optimal kontrol ile kısıtlı yeniden giriş uçuşunun gürbüz yörünge eniyilemesi
AKAN SELİM
Yüksek Lisans
İngilizce
2022
Astronomi ve Uzay Bilimleriİstanbul Teknik ÜniversitesiUçak ve Uzay Mühendisliği Ana Bilim Dalı
PROF. DR. İBRAHİM OZKOL
- Machine learning based design of gap waveguides
Makine öğrenmesi tabanlı boşluk dalga kılavuzu tasarımı
UĞUR ALKAŞI
Yüksek Lisans
İngilizce
2022
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
PROF. DR. MEHMET ÇAYÖREN
- Active learning based human in the loop deep object detectionfor scalable data annotation
Ölçeklenebilir veri etiketlenmesi için aktif öğrenme tabanlı insan katılımlı derin nesne tespiti sistemi
ATABERK ARMAN KAYHAN
Yüksek Lisans
İngilizce
2021
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiUçak ve Uzay Mühendisliği Ana Bilim Dalı
DOÇ. DR. NAZIM KEMAL ÜRE
- Sabit güçlü yüklere sahip doğru akım mikro şebekelerde öğrenme tabanlı gerilim regülasyonu
Learning-based voltage regulation in direct current micro-grids with constant power loads
MUSTAFA GÜNGÖR
Doktora
Türkçe
2024
Elektrik ve Elektronik MühendisliğiDicle ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ MEHMET EMİN ASKER
- Uzaktan eğitimin internette uygulanmasında arayüz oluşturma
A Shell system for the implementation of distance education on internet
E. ŞEYDA KOCAMAN
Yüksek Lisans
Türkçe
2002
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolEge ÜniversitesiUluslararası Bilgisayar Ana Bilim Dalı
DOÇ. DR. BAHAR KARAOĞLAN