Geri Dön

Using ladder network for semi-supervised sentiment analysis

Yarı-denetimli duygu analizi için basamaklı ağ yönteminin kullanılması

  1. Tez No: 648280
  2. Yazar: DANIEH ALDAGHSTANI
  3. Danışmanlar: DR. ÖĞR. ÜYESİ CEMAL OKAN ŞAKAR
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2020
  8. Dil: İngilizce
  9. Üniversite: Bahçeşehir Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 67

Özet

İnternette sayısı gün geçtikçe artan yapılandırılmamış metin verisiyle birlikte, metin sınıflandırması, metin verilerinin düzenlenmesi ve işlenmesi için ana yöntemlerden biri haline gelmiştir. Metin sınıflandırması, bir metnin kategorisini belirlemek için metne doğru etiket atama işlemidir. Bu amaç için çeşitli denetimli, denetimsiz ve yarı denetimli öğrenme yöntemleri önerilmiştir. Bu tez çalışmasında, metin sınıflandırma problemlerinde yeterli sayıda etiketli verinin eksikliği ve çok sayıda etiketlenmemiş verinin varlığı düşünülerek, iki tür veriyi öğrenme sürecine entegre ederek, makine öğrenmesi modelinin performansını artırmak amacıyla yarı-denetimli öğrenme yöntemlerinin analiz edilmesi amaçlanmıştır. Bu amaca yönelik olarak, ikili metin sınıflandırması için, son zamanlarda önerilen ve denetimli ve denetimsiz maliyet değerini amaç fonksiyonuna entegre ederek geri yayılım algoritmasıyla hatayı en aza indirmeye çalışan basamaklı ağlar algoritması kullanılarak, hem etiketlenmiş hem de etiketlenmemiş metin örneklerini öğrenme sürecine dahil eden bir yapay sinir ağı eğitimi gerçeklenmiştir. Öznitelik çıkarımı için en çok kullanılan geleneksel yöntemlerden birisi olan Terim Frekansı-Ters Döküman Frekansı isimli metin temsil yöntemi kullanılmıştır. Basamaklı ağlar algoritmasının performansı çok-katmanlı algılayıcı ve destek vektör makineleri olmak üzere iki denetimli öğrenme algoritmasıyla çok az sayıda etiketli örnek kullanılarak karşılaştırılmıştır. Elde edilen deneysel sonuçlar basamaklı ağlar algoritmasının, eğitim kümesinin çok az sayıda etiketli ve çok sayıda etiketsiz metin verisini içerdiği durumlarda başarıyla uygulanabileceğini göstermiştir.

Özet (Çeviri)

With significantly increased unstructured text data on Internet, the text classification has become one of the main methods for organizing and processing textual data. Text classification is a process of assigning a correct label to a text in order to determine its category. There are various supervised learning, unsupervised learning, or semi-supervised learning methods proposed for this problem. In this thesis, considering the lack of sufficient labeled data and the availability of huge amount of unlabeled data in text classification tasks, we aim to analyze the performance of semi-supervised learning (SSL) approach in order to improve the performance of machine learning model by integrating two types of data into learning process. Based on this, we address the task of training a neural network for sentiment classification utilizing both labeled and unlabeled text samples by using the recently proposed algorithm called Ladder Network which attempts to combine supervised and unsupervised cost values into the objective function and minimizes the error by utilizing back-propagation. We utilize a commonly used traditional technique, the Term Frequency-Inverse Document Frequency (TF-IDF) text representation method, to extract features. We compare the performance of the Ladder Network and two types of supervised learning methods, multilayer perceptron and support vector machine (SVM), using a few number of labeled instances. The experimental results show that this algorithm can be applied successfully where the training data-set contains a few labeled and a huge number of unlabeled text data.

Benzer Tezler

  1. Explicit solutions of two-variable scattering equations and broadband matching network design

    İki değişkenli saçılma denklemlerinin analizi ve genişbant uyumlaştırıcı tasarımı

    GÖKER EKER

    Yüksek Lisans

    İngilizce

    İngilizce

    2019

    Elektrik ve Elektronik MühendisliğiKadir Has Üniversitesi

    Elektronik Mühendisliği Ana Bilim Dalı

    PROF. DR. METİN ŞENGÜL

  2. Akademik yazma zanaatı: Sosyoloji alanı üzerine bir araştırma

    The craft of academic writing: A study on the field of sociology

    SEFA ALTAY

    Doktora

    Türkçe

    Türkçe

    2024

    SosyolojiAnkara Yıldırım Beyazıt Üniversitesi

    Sosyoloji Ana Bilim Dalı

    PROF. DR. MUSA ÖZTÜRK

  3. Kuru tip transformatörlerde kısmi deşarjın sargı içerisindeki yerinin tespit edilmesi

    Localization of partial discharge in a winding of dry-type transformers

    MUZAFFER ERDOĞAN

    Doktora

    Türkçe

    Türkçe

    2023

    Elektrik ve Elektronik MühendisliğiBalıkesir Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ MEHMET KUBİLAY EKER

  4. Milimetre dalga boyunda yüzgeç hat karıştırıcı tasarımı

    Balanced finline mixer design in millimeter wawe band

    DEMET SEVİL ARMAĞAN

    Yüksek Lisans

    Türkçe

    Türkçe

    1995

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    PROF.DR. OSMAN PALAMUTÇUOĞLU

  5. Bandwidth enhancement techniques for CMOS transimpedance amplifier

    CMOS transferempedans kuvvetlendiricinin bant genişliği başarımını geliştirmeye yönelik teknikler

    JAWDAT ABUTAHA

    Doktora

    İngilizce

    İngilizce

    2016

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    DOÇ. DR. METİN YAZGI