Duygu analizinde öznitelik seçme metriklerinin değerlendirilmesi: Türkçe film eleştirileri
Assesment of feature selection metrics for sentiment analysis: Turkish movie reviews
- Tez No: 379610
- Danışmanlar: DOÇ. DR. EBRU AKCAPINAR SEZER
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2014
- Dil: Türkçe
- Üniversite: Hacettepe Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 76
Özet
İnternet hizmetlerindeki gelişmeler ve İnternet kullanıcıları sayısındaki artış, günlük aktivitelerimizde İnternet kullanımını daha gelişmiş bir seviyeye taşımıştır. Günümüzde insanlar talep ettikleri bilgiye İnternet üzerinde yaptıkları basit bir arama ile kolayca ulaşabilmektedirler. Hatta İnternet kullanımındaki yeni gelişmeler, kullanıcılara İnternetteki bilgileri sorgulayabilmelerine olanak vermektedir. İnternetteki bilgilerin büyük bir kısmı geribildirim yapılmasına açıktır. Bu geri bildirimler; anketler ve forum web siteleri aracılığıyla ilgili kuruluşlar tarafından yeni fikirleri analiz edebilmek için toplanmaktadır. Geribildirimlerin kısa sure içerisinde insan gücü ile analizi çok zordur. Çünkü çok fazla İnternet kullanıcısı olmasından dolayı bu yorumların değerlendirilmeleri için uzun bir işlem süresine gereksinim duyulmaktadır. Duygu analizi kavramı da bu fikirlerin ne kadar olumlu ve olumsuz olduğunu sınıflama aşamasında ortaya çıkan problemlerin çözümü noktasında keşfedilmiştir. Bu tezde, duygu analizi yöntemlerinin başarı oranları karşılaştırılarak incelenmiştir. Uygulanan birtakım deney sonuçlarına göre, kısa sürede cevap verebilecek ve daha az insan gücüne ihtiyaç duyacak bir sistem oluşturulmasına çalışılmıştır. Tezde kullanılan veriler Türkçe film yorumları web sitesi üzerindeki kullanıcılar tarafından yorumlanıp puanlandırılmıştır. Bu veriler 0,5 ile 5,0 aralığında puanlandırılmıştır. Öznitelik seçme metrikleri istatistik alanında yaygın olarak kullanılmaktadır. Veriler elde edildikten sonra, bu araştırmanın gereksinimlerine cevap verebilmek için Destekçi Vektör Makineleri (SVM) ile öznitelik seçme metriklerinin çeşitli kategorilere ait yorumlardaki ayrıştırıcı özelliği kullanılarak, SVM'nin başarısına nasıl bir katkı yaptığı tespit edilmiştir. Önerilen sistem tasarımında sadece olumlu ve olumsuz kategorileri sınıflarken %83,9 F1 değeri elde edilmiştir. Olumlu, olumsuz ve nötr yorumları sınıflarken ise %63,3 F1 başarı değerine ulaşmıştır. Literatür araştırmalarındaki bulgulara dayanarak; önerilen sistem tasarımı, öznitelik seçme metriklerinin duygu analizinde başarı ile kullanılabileceğini kanıtlamaktadır. Önerilen bu yeni sistem tasarımının duygu analizi konusuna yeni bir bakış açısı getireceğine inanmaktayız.
Özet (Çeviri)
Achievements in the Internet services and the increase in the number of Internet users transformed our daily Internet activities to an upper level. People can easily access to their demand via a simple search on the Internet. Even these achievements enable users to query Internet information. Most part of the information presented on the Internet is open for feedbacks. User feedbacks have been captured from polls and forum web sites to be analyzed and produce new ideas. In fact it is hard to analyze them manually in a short time due to existence of huge amount of Internet users' reviews and so much processing time and effort required to evaluate these reviews. Sentiment Analysis concept has been discovered to solve problems occurred while classifying opinions by separating positive and negative reviews. Sentiment analysis concept was discovered at the point of assessing these reviews by means of classifying them into“positive”and“negative”. In this thesis, sentiment analysis methods are investigated by considering their success rates. According to several experiment results, it is tried to develop a system that answers in a short time and needs less human efforts. The data used in the thesis was commented and rated by users of Turkish movie reviews web site. This data was rated by gaps between '0.5' and '5.0' points. Feature Selection metrics have been used frequently in the field of statistical. Upon gathering the data, how the use of discrimination feature of SVM and feature selection metrics in comments of various categories has contributed to SVM's success has been discovered. In the proposed system design, 83.9% F1 score is obtained while classifying only positive and negative reviews. While classifying both of positive, negative and neutral reviews, 63.3% F1 achievement score was reached. Based on findings in the literature review, proposed system design proves feature selection metrics can be used successfully in the sentiment analysis. We believe this proposed system design will bring a new perspective in the field of Sentiment analysis.
Benzer Tezler
- Sentiment analysis model proposal with deep learning techniques on big data: Portfolio selection with the help of industry indicators
Büyük veri üzerinde derin öğrenme teknikleri ile duygu analizi model önerisi: Sektör göstergeleri yardımıyla portföy seçimi
MAHMUT SAMİ SİVRİ
Doktora
İngilizce
2023
Endüstri ve Endüstri Mühendisliğiİstanbul Teknik ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
PROF. DR. ALP ÜSTÜNDAĞ
- EEG tabanlı duygu kestirim uygulamaları için kaotik analiz ile öznitelik seçme
Feature selection for EEG based emotion prediction applications through chaotic analysis
ŞUAYİP ACAR
Yüksek Lisans
Türkçe
2016
Elektrik ve Elektronik MühendisliğiDumlupınar ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
DOÇ. DR. HAMDİ MELİH SARAOĞLU
- Chair recognition and cognitive based chair selection algorithms for humanoid robots
Sandalye tanıma ve bilişsel tabanlı sandalye seçme algoritmalarının insansı robotlara uygulanması
FATMA GÖNGÖR
Yüksek Lisans
İngilizce
2018
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAdana Bilim ve Teknoloji ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
DOÇ. DR. ÖNDER TUTSOY
- Aspect based opinion mining on Turkish tweets
Türkce tweetlerde konu bazli düşünce analizi
ESRA AKBAŞ
Yüksek Lisans
İngilizce
2012
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİhsan Doğramacı Bilkent ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. HAKAN FERHATOSMANOĞLU
- An embedded design and implementation of a facial expression recognition system
Yüz ifadelerini tanıma sistemi gömülü sistem tasarım ve uygulaması
ÖMER SÜMER
Yüksek Lisans
İngilizce
2014
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
PROF. DR. ECE OLCAY GÜNEŞ