Geri Dön

Türkçe metinlerde sözlük tabanlı yaklaşımla duygu analizi ve görselleştirme

Sentiment analysis and visualization by dictionary based approach in Turkish texts

  1. Tez No: 577561
  2. Yazar: ABDOULAYE ISSA BABAN CHAWAI
  3. Danışmanlar: DR. ÖĞR. ÜYESİ ÖNDER DEMİR, DR. ÖĞR. ÜYESİ BUKET DOĞAN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Metin madenciliği, duygu analizi, metin sınıflandırması, makine öğrenmesi, Text Mining, Sentiment Analysis, Text Classification, Machine Learning
  7. Yıl: 2019
  8. Dil: Türkçe
  9. Üniversite: Marmara Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
  13. Sayfa Sayısı: 65

Özet

Metin madenciliği (TM) yaklaşımları, yapılandırılmamış metinden otomatik olarak faydalı bilgilerin çıkarılmasını kolaylaştırmak için önem kazanmaktadır. Bu amaçla kullanılan metin madenciliği yöntemleri ile büyük miktardaki metin verileri, kısa zamanda ve yüksek performans ile analiz edilebilmektedir. Bu çalışmanın temel amacı, kelime sıklığı, bilgi çıkarma, sınıflandırma, makine öğrenmesi, veri işleme ve çıkarma gibi araçlarla Türkçe metinlerinin işlenmesi ve görselleştirilmesidir. Metin madenciliği alanlarından biri olan duygu analizi veya fikir madenciliği, görüşler, tutumlar ve duygular gibi öznel bilgilerin algılanmasını otomatikleştirmek için kullanılmaktadır. Bu tezde sunulan çalışmada, tweet, roman, müşteri yorumları gibi Türkçe metinlerin analizine ihtiyaç duyulduğu durumlarda kullanılabilecek yeni bir araç önerilmektedir. Geliştirilen uygulama esas olarak duygu analizi yaparken“kelime düzeyinde”çalışmaktadır. Buna ek olarak, duygu analizinde kullanılan sözlük sıfatlar, isimler, fiiller, zarflar, ön ekler, son ekler tğrğnde kelimeler içermektedir. Kullanılan birinci sözlük 5.000 kelime, ikinci sözlük 25.000 kelime ve üçüncü için de yaklaşık 25.000 kelime içermektedir. Tez üç bölümden oluşmaktadır.: Bölüm 1'de Tezin genel girişinde sırasıyla metin madenciliğine ve duygu analizine özgü tanımlar verilmiştir, ardında tez çalışmanın amacı ve önemi hakkında daha fazla bilgi paylaşmıştır. Son olarak metin madenciliği ile ilgili alanlardan ve çalışmalardan bahsedilmiştir. Bölüm 2'de ise kullanılan materyal ve yöntemlerden bahsedilmiştir. Bu bölümde belge korpusunun nasıl temsil edildiği, kullanılan sınıflandırma teknikleri, duygu analizi yöntemleri, tez çalışmasında kullanılan sözlükler ve genel sistem mimarisi açıklanmaktadır. Bölüm 3'te ise geliştirilen duygu analizi sistemine ait sonuçlar ve önerileri içermektedir

Özet (Çeviri)

Text mining (TM) approaches are important in order to facilitate the automatic extraction of useful information from unstructured text. In this purpose, with the utilization of Text Mining methods, large amounts of text data can be analyzed in a short time and with high performance. The main purpose of this study is to process and visualize Turkish texts with the help of tools such as word frequency, information extraction, classification, machine learning, data processing and extraction. Sentiment Analysis or Opinion Mining is one of the text mining fields wich is used to automate the perception of subjective information such as opinions, attitudes and emotions. The study presented in this thesis is a new tool proposed that can be used when the analysis of Turkish texts such as tweets, novels, customer comments is needed. While searching or making sentiment analysis, the developed application works mainly at the word level. In addition, the dictionary used in emotion analysis includes differents words like adjectives, nouns, verbs, adverbs, prefixes, suffixes. The first dictionary used is AFINN with 5,000 words, the second dictionary BING contains 25,000 words and the third dictionary NRC contains approximately 25,000 words. The thesis consists of three parts: In Chapter 1, in the general introduction of the thesis, the specific definitions of Text Mining and Sentiment Analysis are given respectively, after which the thesis shares more information about the purpose and importance of the study. Finally, the fields and studies related to text mining are mentioned. In Chapter 2, the materials and methods used are mentioned. This section describes how the document corpus is represented, the classification techniques used, the sentiment analysis methods, the dictionaries used in the thesis study and the architecture of the general system. Chapter 3 contains the results and recommendations of the developed Sentiment Analysis system.

Benzer Tezler

  1. Eğitimde metin madenciliği: Türkçe metinlerde sözlük tabanlı duygu analizi

    Text mining in education: Dictionary-based in Turkish texts sentiment analysis

    LEYLA KARAKUŞ

    Yüksek Lisans

    Türkçe

    Türkçe

    2021

    Eğitim ve ÖğretimAkdeniz Üniversitesi

    Eğitim Bilimleri Ana Bilim Dalı

    DOÇ. DR. BİLAL BARIŞ ALKAN

  2. Lexicon-based emotion analysis in Turkish

    Türkçe metinlerde sözlük tabanlı duygu analizi

    MANSUR ALP TOÇOĞLU

    Doktora

    İngilizce

    İngilizce

    2018

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolDokuz Eylül Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ADİL ALPKOÇAK

  3. Türkçe metinlerde duygu analizi

    Sentiment analysis in Turkish texts

    CUMALİ TÜRKMENOĞLU

    Yüksek Lisans

    Türkçe

    Türkçe

    2015

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. AHMET CÜNEYD TANTUĞ

  4. Multilevel sentiment analysis in Arabic

    Arapça için çok düzeyli duygu analizi

    AHMED NASSAR

    Doktora

    İngilizce

    İngilizce

    2017

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHacettepe Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. EBRU AKÇAPINAR SEZER

  5. Anahtar uzayı taraması için, açık metin tanıma ve kelimelerine ayrıştırma üzerine bir çalışma

    A study on recognition of the plaintext and its decomposition into words for key space search

    HAYRİYE ERFİDAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2006

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolEge Üniversitesi

    Uluslararası Bilgisayar Ana Bilim Dalı

    PROF.DR. MEHMET EMİN DALKILIÇ