Lexicon based opinion mining on twitter data by using hadoop
Hadoop kullanarak twitter verileri üzerindeki görüş madenciliği tabanlı veri sözlüğü
- Tez No: 495504
- Danışmanlar: Assist. Prof. Dr. ABDÜL KADİR GÖRÜR
- Tez Türü: Yüksek Lisans
- Konular: Bilim ve Teknoloji, Science and Technology
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2017
- Dil: İngilizce
- Üniversite: Çankaya Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Matematik Ana Bilim Dalı
- Bilim Dalı: Bilgi Teknolojileri Bilim Dalı
- Sayfa Sayısı: 80
Özet
Bu tezde, Hadoop tarafından Sanal Makine ile makine öğrenme metodolojilerini kullanarak elde edilen varsayımların bulgularını vurgulayacağız. Pratik kurulum, belirli kelimeleri kullanarak twitler incelemek ve bulmak için deneyler gerçekleştirmek üzere başlatıldı ve bu twitler sadece belirli bir alan içerisinde toplanacak ve veriler Hadoop'ta saklanacaktır. Ardından, ön işleme işlemleri gibi eğitim verileri, gerekli olmayan her şeyi kaldırıp, özellikleri ayıklamaktır. Bundan sonra, twit microblog'un metinlerini analiz etme yeteneğiyle makine öğrenme algoritmaları (gözetim altında ve denetlenmemiş) kullanarak twitlerin sınıflandırılması, farklı türdeki sözlüğün duygularını algılamaktır. Ayrıca Mahout'daki kümesi, aynı kutupta veri toplayıp olumlu ifade edilen veya en iyi hizmetin ne olduğunu bilmek için kullanılmıştır. Sonunda, sınıflamanın doğruluğuna dayanarak elde edilen başarılı sonuçlardan toplanan hedefleri kanıtlıyoruz.
Özet (Çeviri)
In this thesis, we will highlight findings of the assumptions obtained by using the methodologies of machine learning with Hadoop by Virtual Machine. The practical setup was started to carry out the experiments to study and find tweets by specific words and these tweets are to be collected only within a specific domain and data is to be saved in Hadoop. Then, training data such as the pre-processing operations is to remove all things which are not necessary and extract the features. After that, the classification of tweets using machine learning algorithms (supervised and unsupervised) with the ability to analyse the texts of tweet microblog is to detect emotions by different types of the lexicon. Furthermore, the cluster in Mahout was used to collect data at same polar to know what is best service or product which was expressed positively. Finally, we prove the objectives which were collected from the achieved results based on accuracy of the classification.
Benzer Tezler
- Türkçe metinlerde duygu analizi
Sentiment analysis in Turkish texts
CUMALİ TÜRKMENOĞLU
Yüksek Lisans
Türkçe
2015
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. AHMET CÜNEYD TANTUĞ
- Twitter verileriyle duygu analizi ve Türkçe duygu kütüphanesi
Sentimental analysis by using tweets and Turkish lexicon
SEMRA YILDIRIM
Yüksek Lisans
Türkçe
2018
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBahçeşehir ÜniversitesiMühendislik Yönetimi Ana Bilim Dalı
YRD. DOÇ. DR. SERKAN AYVAZ
- Aspect based opinion mining on Turkish tweets
Türkce tweetlerde konu bazli düşünce analizi
ESRA AKBAŞ
Yüksek Lisans
İngilizce
2012
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİhsan Doğramacı Bilkent ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. HAKAN FERHATOSMANOĞLU
- A lexicon based method for subjectivity and sentiment analysis using an Arabic twitter corpus
Arapça twitter korpusu ile öznellik ve sentıment analizi için sözlük tabanlı yöntem
NASEER MOHAMMED JASIM AL-BUHRUZI
Yüksek Lisans
İngilizce
2017
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolÇankaya ÜniversitesiMatematik Ana Bilim Dalı
YRD. DOÇ. DR. ABDÜL KADİR GÖRÜR
- Stock value prediction using machine learning and text mining
Makine öğrenmesi ve metin madenciliği kullanılarak hisse senedi fiyatlarının tahminlendirilmesi.
AYŞENUR DİLARA ÇELİKEL
Yüksek Lisans
İngilizce
2018
Bilim ve TeknolojiKadir Has ÜniversitesiYönetim Bilişim Sistemleri Ana Bilim Dalı
PROF. DR. HASAN DAĞ