Türkçe metinlerde sözlük tabanlı yaklaşımla duygu analizi ve görselleştirme
Sentiment analysis and visualization by dictionary based approach in Turkish texts
- Tez No: 577561
- Danışmanlar: DR. ÖĞR. ÜYESİ ÖNDER DEMİR, DR. ÖĞR. ÜYESİ BUKET DOĞAN
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Metin madenciliği, duygu analizi, metin sınıflandırması, makine öğrenmesi, Text Mining, Sentiment Analysis, Text Classification, Machine Learning
- Yıl: 2019
- Dil: Türkçe
- Üniversite: Marmara Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
- Sayfa Sayısı: 65
Özet
Metin madenciliği (TM) yaklaşımları, yapılandırılmamış metinden otomatik olarak faydalı bilgilerin çıkarılmasını kolaylaştırmak için önem kazanmaktadır. Bu amaçla kullanılan metin madenciliği yöntemleri ile büyük miktardaki metin verileri, kısa zamanda ve yüksek performans ile analiz edilebilmektedir. Bu çalışmanın temel amacı, kelime sıklığı, bilgi çıkarma, sınıflandırma, makine öğrenmesi, veri işleme ve çıkarma gibi araçlarla Türkçe metinlerinin işlenmesi ve görselleştirilmesidir. Metin madenciliği alanlarından biri olan duygu analizi veya fikir madenciliği, görüşler, tutumlar ve duygular gibi öznel bilgilerin algılanmasını otomatikleştirmek için kullanılmaktadır. Bu tezde sunulan çalışmada, tweet, roman, müşteri yorumları gibi Türkçe metinlerin analizine ihtiyaç duyulduğu durumlarda kullanılabilecek yeni bir araç önerilmektedir. Geliştirilen uygulama esas olarak duygu analizi yaparken“kelime düzeyinde”çalışmaktadır. Buna ek olarak, duygu analizinde kullanılan sözlük sıfatlar, isimler, fiiller, zarflar, ön ekler, son ekler tğrğnde kelimeler içermektedir. Kullanılan birinci sözlük 5.000 kelime, ikinci sözlük 25.000 kelime ve üçüncü için de yaklaşık 25.000 kelime içermektedir. Tez üç bölümden oluşmaktadır.: Bölüm 1'de Tezin genel girişinde sırasıyla metin madenciliğine ve duygu analizine özgü tanımlar verilmiştir, ardında tez çalışmanın amacı ve önemi hakkında daha fazla bilgi paylaşmıştır. Son olarak metin madenciliği ile ilgili alanlardan ve çalışmalardan bahsedilmiştir. Bölüm 2'de ise kullanılan materyal ve yöntemlerden bahsedilmiştir. Bu bölümde belge korpusunun nasıl temsil edildiği, kullanılan sınıflandırma teknikleri, duygu analizi yöntemleri, tez çalışmasında kullanılan sözlükler ve genel sistem mimarisi açıklanmaktadır. Bölüm 3'te ise geliştirilen duygu analizi sistemine ait sonuçlar ve önerileri içermektedir
Özet (Çeviri)
Text mining (TM) approaches are important in order to facilitate the automatic extraction of useful information from unstructured text. In this purpose, with the utilization of Text Mining methods, large amounts of text data can be analyzed in a short time and with high performance. The main purpose of this study is to process and visualize Turkish texts with the help of tools such as word frequency, information extraction, classification, machine learning, data processing and extraction. Sentiment Analysis or Opinion Mining is one of the text mining fields wich is used to automate the perception of subjective information such as opinions, attitudes and emotions. The study presented in this thesis is a new tool proposed that can be used when the analysis of Turkish texts such as tweets, novels, customer comments is needed. While searching or making sentiment analysis, the developed application works mainly at the word level. In addition, the dictionary used in emotion analysis includes differents words like adjectives, nouns, verbs, adverbs, prefixes, suffixes. The first dictionary used is AFINN with 5,000 words, the second dictionary BING contains 25,000 words and the third dictionary NRC contains approximately 25,000 words. The thesis consists of three parts: In Chapter 1, in the general introduction of the thesis, the specific definitions of Text Mining and Sentiment Analysis are given respectively, after which the thesis shares more information about the purpose and importance of the study. Finally, the fields and studies related to text mining are mentioned. In Chapter 2, the materials and methods used are mentioned. This section describes how the document corpus is represented, the classification techniques used, the sentiment analysis methods, the dictionaries used in the thesis study and the architecture of the general system. Chapter 3 contains the results and recommendations of the developed Sentiment Analysis system.
Benzer Tezler
- Eğitimde metin madenciliği: Türkçe metinlerde sözlük tabanlı duygu analizi
Text mining in education: Dictionary-based in Turkish texts sentiment analysis
LEYLA KARAKUŞ
Yüksek Lisans
Türkçe
2021
Eğitim ve ÖğretimAkdeniz ÜniversitesiEğitim Bilimleri Ana Bilim Dalı
DOÇ. DR. BİLAL BARIŞ ALKAN
- Lexicon-based emotion analysis in Turkish
Türkçe metinlerde sözlük tabanlı duygu analizi
MANSUR ALP TOÇOĞLU
Doktora
İngilizce
2018
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolDokuz Eylül ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. ADİL ALPKOÇAK
- Türkçe metinlerde duygu analizi
Sentiment analysis in Turkish texts
CUMALİ TÜRKMENOĞLU
Yüksek Lisans
Türkçe
2015
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. AHMET CÜNEYD TANTUĞ
- Multilevel sentiment analysis in Arabic
Arapça için çok düzeyli duygu analizi
AHMED NASSAR
Doktora
İngilizce
2017
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHacettepe ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. EBRU AKÇAPINAR SEZER
- Anahtar uzayı taraması için, açık metin tanıma ve kelimelerine ayrıştırma üzerine bir çalışma
A study on recognition of the plaintext and its decomposition into words for key space search
HAYRİYE ERFİDAN
Yüksek Lisans
Türkçe
2006
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolEge ÜniversitesiUluslararası Bilgisayar Ana Bilim Dalı
PROF.DR. MEHMET EMİN DALKILIÇ