Geri Dön

Developing a comprehensive framework for sentiment analysis in Turkish

Türkçe için kapsamlı bir duygu analizi çatısı geliştirme

  1. Tez No: 645129
  2. Yazar: CEM RIFKI AYDIN
  3. Danışmanlar: PROF. DR. TUNGA GÜNGÖR, PROF. DR. SADIK FİKRET GÜRGEN, DR. ÖĞR. ÜYESİ TEVFİK AYTEKİN
  4. Tez Türü: Doktora
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2020
  8. Dil: İngilizce
  9. Üniversite: Boğaziçi Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
  13. Sayfa Sayısı: 171

Özet

Bu çalışmada, Türkçe için geniş kapsamlı bir duygu analizi çatısı oluşturulmuştur. Ayrıca, İngilizce'de duygu analizine özel bazı yaklaşımlar da geliştirilmiştir. Bu kapsamda bu problemin bir sürü yönü göz önünde bulundurulmuştur. Beş tane ana katkı ve üç tane küçük katkıda bulunulmuştur. Denetimsiz, yarı denetimli ve denetimli yöntemlerle orijinal ve etkili öznitelik kümeleri oluşturulmuştur. Bundan sonra, bu öznitelikler klasik makine öğrenme metotlarına girdi olarak verilmiştir ve Türkçe ile İngilizce dillerindeki veri setleri için, yapay sinir ağlarının performansı geçilmiştir. Türkçe dili için ilk defa yarı denetimli yöntemlerle duygu sözlükleri oluşturulmuştur. Sondan eklemeli Türkçe dili için detaylı bir biçimbilimsel analiz gerçekleştirilmiş ve eklerin duygu skorları tespit edilmiştir. Bu, biçimsel olarak zengin diğer dillere de uygulanabilmektedir. Tekrarlamalı ve yinelemeli sinir ağı modellerini birleştiren özgün bir yapay sinir ağı mimarisi geliştirilmiştir. Duygusal, sözdizimsel, anlamsal ve sözlüksel öznitelikler hesaba katılarak, hem Türkçe hem İngilizce için özgün kelime vektörleri oluşturulmuştur. Ayrıca, bağlam pencereleri yancümlecik olarak belirlenerek İngilizce için kısmen orijinal bir yöntemle kelime vektörleri modellenmiştir. Bu, diğer dilbilimsel alanlara ve doğal dil işleme alanlarına uyarlanabilmektedir. Bütün bu özgün yaklaşımlar için, ölçüt olarak alınan çalışmaların başarı oranları geçilmiştir. Küçük çaplı katkılarımız, Türkçe için yön bazlı duygu analizi, yarı denetimli metot için parametrelerin değiştirilmesi ve İngilizce'de duygu analizi için yorumlarda yönlerin tespit edilmesi olarak belirtilebilir. Bu tez, Temmuz, 2020 itibariyle Türkçe için geliştirilmiş en kapsamlı çalışma olarak atfedilebilir. Bu çalışma aynı zamanda İngilizce'de duygu analizi alanı için önemli katkılarda bulunmuştur.

Özet (Çeviri)

In this thesis, we developed a comprehensive framework for sentiment analysis that takes its many aspects into account mainly for Turkish. We have also proposed several approaches specific to sentiment analysis in English only. We have accordingly made five major and three minor contributions. We generated a novel and effective feature set by combining unsupervised, semi-supervised, and supervised metrics. We then fed them as input into classical machine learning methods, and outperformed neural network models for datasets of different genres in both Turkish and English. We created a polarity lexicon with a semi-supervised domain-specific method, which has been the first approach applied for corpora in Turkish. We performed a fine morphological analysis for the sentiment classification task in Turkish by determining the polarities of morphemes. This can be adapted to other morphologically-rich or agglutinative languages as well. We have built a novel neural network architecture, which combines recurrent and recursive neural network models for English. We built novel word embeddings that exploit sentiment, syntactic, semantic, and lexical characteristics for both Turkish and English. We also redefined context windows as subclauses in modelling word representations in English. This can also be applied to other linguistic fields and natural language processing tasks. We have achieved state-of-the-art and significant results for all these original approaches. Our minor contributions include methods related to aspect-based sentiment in Turkish, parameter redefinition in the semi-supervised approach, and aspect term extraction techniques for English. This thesis can be considered the most detailed and comprehensive study made on sentiment analysis in Turkish as of July, 2020. Our work has also contributed to the opinion classification problem in English.

Benzer Tezler

  1. Tectonic and magmatic structure of Lake Van basin and its structural evolution, Eastern Anatolia accretionary complex (EAAC), East-Turkey

    Van Gölü havzasının tektonik ve magmatik yapısı ve yapısal evrimi, Doğu Anadolu yığışım karmaşığı (DAYK), Doğu Türkiye

    MUSTAFA TOKER

    Doktora

    İngilizce

    İngilizce

    2011

    Jeofizik Mühendisliğiİstanbul Teknik Üniversitesi

    İklim ve Deniz Bilimleri Ana Bilim Dalı

    PROF. DR. A. M. CELAL ŞENGÖR

  2. Deniz yapılarının çok kriterli karar verme yöntemi (ÇKKV) ile planlanması ve tasarım parametrelerinin uyarlamalı ağ tabanlı bulanık çıkarım sistemi ile tahmini

    Planning of marine structures with multi-criteria decision-making (MCDM) and estimating design parameters with adaptive network-based fuzzy inference system

    BÜŞRA BİÇER AYMERGEN

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    İnşaat MühendisliğiGazi Üniversitesi

    İnşaat Mühendisliği Ana Bilim Dalı

    PROF. DR. CAN ELMAR BALAS

  3. Anahtar teslimi mühendislik-satınalma-yapım sözleşmelerde bir risk yönetimi sistematiği geliştirilmesi

    Developing a risk management systematic for turnkey engineering-procurement-construction contracts

    CELALETTİN İLHAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2010

    İnşaat Mühendisliğiİstanbul Teknik Üniversitesi

    İnşaat Mühendisliği Ana Bilim Dalı

    DOÇ. DR. UĞUR MÜNGEN

  4. Integrating a scale transition system into the scan-to-HBIM process

    Taramadan tarihi yapı bilgi modeline geçişte ölçekler arası ilişkilerin bütünleştirilmesi

    BERKAY ÖZTÜRK

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Mimarlıkİstanbul Teknik Üniversitesi

    Bilişim Ana Bilim Dalı

    PROF. DR. MİNE ÖZKAR KABAKÇIOĞLU

  5. Yüklenici inşaat firmaları için çok kriterli performans ölçme modeli

    Multi-criteria performance measurement model for construction contractors

    IŞILAY TEKÇE

    Doktora

    Türkçe

    Türkçe

    2010

    Mimarlıkİstanbul Teknik Üniversitesi

    Mimarlık Ana Bilim Dalı

    PROF. DR. ATTİLA DİKBAŞ