Using ladder network for semi-supervised sentiment analysis
Yarı-denetimli duygu analizi için basamaklı ağ yönteminin kullanılması
- Tez No: 648280
- Danışmanlar: DR. ÖĞR. ÜYESİ CEMAL OKAN ŞAKAR
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2020
- Dil: İngilizce
- Üniversite: Bahçeşehir Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 67
Özet
İnternette sayısı gün geçtikçe artan yapılandırılmamış metin verisiyle birlikte, metin sınıflandırması, metin verilerinin düzenlenmesi ve işlenmesi için ana yöntemlerden biri haline gelmiştir. Metin sınıflandırması, bir metnin kategorisini belirlemek için metne doğru etiket atama işlemidir. Bu amaç için çeşitli denetimli, denetimsiz ve yarı denetimli öğrenme yöntemleri önerilmiştir. Bu tez çalışmasında, metin sınıflandırma problemlerinde yeterli sayıda etiketli verinin eksikliği ve çok sayıda etiketlenmemiş verinin varlığı düşünülerek, iki tür veriyi öğrenme sürecine entegre ederek, makine öğrenmesi modelinin performansını artırmak amacıyla yarı-denetimli öğrenme yöntemlerinin analiz edilmesi amaçlanmıştır. Bu amaca yönelik olarak, ikili metin sınıflandırması için, son zamanlarda önerilen ve denetimli ve denetimsiz maliyet değerini amaç fonksiyonuna entegre ederek geri yayılım algoritmasıyla hatayı en aza indirmeye çalışan basamaklı ağlar algoritması kullanılarak, hem etiketlenmiş hem de etiketlenmemiş metin örneklerini öğrenme sürecine dahil eden bir yapay sinir ağı eğitimi gerçeklenmiştir. Öznitelik çıkarımı için en çok kullanılan geleneksel yöntemlerden birisi olan Terim Frekansı-Ters Döküman Frekansı isimli metin temsil yöntemi kullanılmıştır. Basamaklı ağlar algoritmasının performansı çok-katmanlı algılayıcı ve destek vektör makineleri olmak üzere iki denetimli öğrenme algoritmasıyla çok az sayıda etiketli örnek kullanılarak karşılaştırılmıştır. Elde edilen deneysel sonuçlar basamaklı ağlar algoritmasının, eğitim kümesinin çok az sayıda etiketli ve çok sayıda etiketsiz metin verisini içerdiği durumlarda başarıyla uygulanabileceğini göstermiştir.
Özet (Çeviri)
With significantly increased unstructured text data on Internet, the text classification has become one of the main methods for organizing and processing textual data. Text classification is a process of assigning a correct label to a text in order to determine its category. There are various supervised learning, unsupervised learning, or semi-supervised learning methods proposed for this problem. In this thesis, considering the lack of sufficient labeled data and the availability of huge amount of unlabeled data in text classification tasks, we aim to analyze the performance of semi-supervised learning (SSL) approach in order to improve the performance of machine learning model by integrating two types of data into learning process. Based on this, we address the task of training a neural network for sentiment classification utilizing both labeled and unlabeled text samples by using the recently proposed algorithm called Ladder Network which attempts to combine supervised and unsupervised cost values into the objective function and minimizes the error by utilizing back-propagation. We utilize a commonly used traditional technique, the Term Frequency-Inverse Document Frequency (TF-IDF) text representation method, to extract features. We compare the performance of the Ladder Network and two types of supervised learning methods, multilayer perceptron and support vector machine (SVM), using a few number of labeled instances. The experimental results show that this algorithm can be applied successfully where the training data-set contains a few labeled and a huge number of unlabeled text data.
Benzer Tezler
- Explicit solutions of two-variable scattering equations and broadband matching network design
İki değişkenli saçılma denklemlerinin analizi ve genişbant uyumlaştırıcı tasarımı
GÖKER EKER
Yüksek Lisans
İngilizce
2019
Elektrik ve Elektronik MühendisliğiKadir Has ÜniversitesiElektronik Mühendisliği Ana Bilim Dalı
PROF. DR. METİN ŞENGÜL
- Akademik yazma zanaatı: Sosyoloji alanı üzerine bir araştırma
The craft of academic writing: A study on the field of sociology
SEFA ALTAY
Doktora
Türkçe
2024
SosyolojiAnkara Yıldırım Beyazıt ÜniversitesiSosyoloji Ana Bilim Dalı
PROF. DR. MUSA ÖZTÜRK
- Kuru tip transformatörlerde kısmi deşarjın sargı içerisindeki yerinin tespit edilmesi
Localization of partial discharge in a winding of dry-type transformers
MUZAFFER ERDOĞAN
Doktora
Türkçe
2023
Elektrik ve Elektronik MühendisliğiBalıkesir ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ MEHMET KUBİLAY EKER
- Milimetre dalga boyunda yüzgeç hat karıştırıcı tasarımı
Balanced finline mixer design in millimeter wawe band
DEMET SEVİL ARMAĞAN
Yüksek Lisans
Türkçe
1995
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiPROF.DR. OSMAN PALAMUTÇUOĞLU
- Bandwidth enhancement techniques for CMOS transimpedance amplifier
CMOS transferempedans kuvvetlendiricinin bant genişliği başarımını geliştirmeye yönelik teknikler
JAWDAT ABUTAHA
Doktora
İngilizce
2016
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
DOÇ. DR. METİN YAZGI