Geri Dön

Lexicon based opinion mining on twitter data by using hadoop

Hadoop kullanarak twitter verileri üzerindeki görüş madenciliği tabanlı veri sözlüğü

  1. Tez No: 495504
  2. Yazar: MOHAMMED RAAED MAHMOOD ALKSSO
  3. Danışmanlar: Assist. Prof. Dr. ABDÜL KADİR GÖRÜR
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilim ve Teknoloji, Science and Technology
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2017
  8. Dil: İngilizce
  9. Üniversite: Çankaya Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Matematik Ana Bilim Dalı
  12. Bilim Dalı: Bilgi Teknolojileri Bilim Dalı
  13. Sayfa Sayısı: 80

Özet

Bu tezde, Hadoop tarafından Sanal Makine ile makine öğrenme metodolojilerini kullanarak elde edilen varsayımların bulgularını vurgulayacağız. Pratik kurulum, belirli kelimeleri kullanarak twitler incelemek ve bulmak için deneyler gerçekleştirmek üzere başlatıldı ve bu twitler sadece belirli bir alan içerisinde toplanacak ve veriler Hadoop'ta saklanacaktır. Ardından, ön işleme işlemleri gibi eğitim verileri, gerekli olmayan her şeyi kaldırıp, özellikleri ayıklamaktır. Bundan sonra, twit microblog'un metinlerini analiz etme yeteneğiyle makine öğrenme algoritmaları (gözetim altında ve denetlenmemiş) kullanarak twitlerin sınıflandırılması, farklı türdeki sözlüğün duygularını algılamaktır. Ayrıca Mahout'daki kümesi, aynı kutupta veri toplayıp olumlu ifade edilen veya en iyi hizmetin ne olduğunu bilmek için kullanılmıştır. Sonunda, sınıflamanın doğruluğuna dayanarak elde edilen başarılı sonuçlardan toplanan hedefleri kanıtlıyoruz.

Özet (Çeviri)

In this thesis, we will highlight findings of the assumptions obtained by using the methodologies of machine learning with Hadoop by Virtual Machine. The practical setup was started to carry out the experiments to study and find tweets by specific words and these tweets are to be collected only within a specific domain and data is to be saved in Hadoop. Then, training data such as the pre-processing operations is to remove all things which are not necessary and extract the features. After that, the classification of tweets using machine learning algorithms (supervised and unsupervised) with the ability to analyse the texts of tweet microblog is to detect emotions by different types of the lexicon. Furthermore, the cluster in Mahout was used to collect data at same polar to know what is best service or product which was expressed positively. Finally, we prove the objectives which were collected from the achieved results based on accuracy of the classification.

Benzer Tezler

  1. Türkçe metinlerde duygu analizi

    Sentiment analysis in Turkish texts

    CUMALİ TÜRKMENOĞLU

    Yüksek Lisans

    Türkçe

    Türkçe

    2015

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. AHMET CÜNEYD TANTUĞ

  2. Twitter verileriyle duygu analizi ve Türkçe duygu kütüphanesi

    Sentimental analysis by using tweets and Turkish lexicon

    SEMRA YILDIRIM

    Yüksek Lisans

    Türkçe

    Türkçe

    2018

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBahçeşehir Üniversitesi

    Mühendislik Yönetimi Ana Bilim Dalı

    YRD. DOÇ. DR. SERKAN AYVAZ

  3. Aspect based opinion mining on Turkish tweets

    Türkce tweetlerde konu bazli düşünce analizi

    ESRA AKBAŞ

    Yüksek Lisans

    İngilizce

    İngilizce

    2012

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİhsan Doğramacı Bilkent Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. HAKAN FERHATOSMANOĞLU

  4. A lexicon based method for subjectivity and sentiment analysis using an Arabic twitter corpus

    Arapça twitter korpusu ile öznellik ve sentıment analizi için sözlük tabanlı yöntem

    NASEER MOHAMMED JASIM AL-BUHRUZI

    Yüksek Lisans

    İngilizce

    İngilizce

    2017

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolÇankaya Üniversitesi

    Matematik Ana Bilim Dalı

    YRD. DOÇ. DR. ABDÜL KADİR GÖRÜR

  5. Stock value prediction using machine learning and text mining

    Makine öğrenmesi ve metin madenciliği kullanılarak hisse senedi fiyatlarının tahminlendirilmesi.

    AYŞENUR DİLARA ÇELİKEL

    Yüksek Lisans

    İngilizce

    İngilizce

    2018

    Bilim ve TeknolojiKadir Has Üniversitesi

    Yönetim Bilişim Sistemleri Ana Bilim Dalı

    PROF. DR. HASAN DAĞ