Geri Dön

İstatistiksel öğrenme yöntemleri ile twitter verilerinin analizi: 1 Kasım 2015 Milletvekili Genel Seçimi süreci

Analysis of twitter data by statistical learning methods: 1 November 2015 Parliamentary General Elections

  1. Tez No: 521898
  2. Yazar: TALİN EVYAPAN
  3. Danışmanlar: DOÇ. DR. AYÇA ÇAKMAK PEHLİVANLI
  4. Tez Türü: Yüksek Lisans
  5. Konular: İstatistik, Statistics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2018
  8. Dil: Türkçe
  9. Üniversite: Mimar Sinan Güzel Sanatlar Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: İstatistik Ana Bilim Dalı
  12. Bilim Dalı: İstatistik Bilim Dalı
  13. Sayfa Sayısı: 78

Özet

Günümüzde Twitter verileri, popülerliği, basit arayüzü ve erişim kolaylığı nedeniyle sosyal medya analizlerinde sıklıkla tercih edilmektedir. Twitter'dan elde edilen veriler veri madenciliği, metin madenciliği, istatistiksel öğrenme gibi yöntemler kullanılarak analiz edilebilmekte ve anlamlı istatistiksel sonuçlar elde edilebilmektedir. Bu çalışma kapsamında elde edilen bulgular doğrultusunda, nitel araştırmaların maliyeti ve süresi ile karşılaştırıldığında, Twitter verilerinin en azından önsel analiz için kullanılmasının oldukça avantajlı olduğu sonucuna varılmıştır. Bu çalışmada, 1 Kasım 2015 Milletvekili Genel Seçimi öncesi atılmış 350.000 tweet analiz için seçilmiş, metin madenciliği ile sayısal verilere dönüştürülmüştür. 350.000 metinden oluşan bu veri birçok önişlemden geçirilerek temizlenmiş ve istatistiksel öğrenmede özellikle metin madenciliğinde sıklıkla kullanılan naive Bayes algoritması ile sınıflandırılmıştır. Sınıflandırma başarısı çeşitli performans ölçütleri ile değerlendirilmiştir. Çalışma kapsamında yapılan uygulamalarda genel başarı oranı %48,2 ve %59,3 arasında değişirken, duygu analizi için yapılan uygulamalarda ise doğruluk oranı %84,6 ile %97,9 arasında değişen değerler almıştır. 1 Kasım 2015 Seçim sonuçlarının tahmini için yapılan uygulamada, 2011 yılına ait geçmiş seçim sonuçlarının siyasi kota olarak kullanılmasına karar verilmiştir ve analiz sonucunda 1 Kasım 2015 yılı resmî sonuçlara oldukça yakın oranlar elde edilmiştir. Buna göre tahmin edilen oranlar; %52,0 AK PARTİ, %23,8 CHP, %14,6 MHP ve %9,6 HDP'dir. Veri analizi aşamasında yapılan metin madenciliği ve istatistiksel öğrenme uygulamaları, halihazırda elimizdeki imkanlar ile twitter verilerinden seçim sonuçları için önsel analizler yapılabildiğini göstermiştir. Ancak tahminlerin daha pratik bir şekilde yapılabilmesi için Türkçe diline uygun sözlük, veri temizleme programı, veri analiz programları gibi materyallerin geliştirilmesi önerilmektedir.

Özet (Çeviri)

Nowadays Twitter is often selected in social media analysis because of its popularity, simple interface and accessibility. Data collected from Twitter can be analysed by using the methods such as data mining, text mining, statistical learning, and meaningful statistical results can be found. In the direction of the findings obtained in this study, when compared with the cost and duration of the qualitative researches, it was concluded that the use of Twitter data for preliminary analysis is more advantageous. In this study, 350.000 tweets selected for analysis which were tweeted before November 1st,2015 Parliamentary General Elections, have been converted to numerical data by text mining. This data, which consists of 350,000 tweets, have been cleaned through many preprocessing and classified by the naive Bayes algorithm, which is frequently used in statistical learning, especially in text mining. Classification performance was assessed with performance measures. In the scope of the study, the correctly classified instances were between 48,2% and 59,3%, in sentiment analysis correctly classified instances was between 84,6% and 97,9%. In the analysis for the estimation of the election results, it was decided to use the past election results which were obtained in 2011 as political quota and the analysis resulted in fairly close proportions to the official results which were obtained in 2015. Therefore estimated rates are 52,0% AK PARTİ, 23,8% CHP, 14,6% MHP and 9,6% HDP. The text mining and statistical learning analysis showed that preliminary analyzes can be done for election results estimation with twitter data. However, in order to make the estimations more practical, it is suggested to develop materials such as dictionary, pre-processing program, data analysis programs in Turkish.

Benzer Tezler

  1. Pre-release forecasting of imdb movie ratings using multi-view data

    Gösterime girmemiş filmlerin ımdb puanının farklı özellik kümeleri kullanılarak tahmin edilmesi

    BEYZA ÇİZMECİ

    Yüksek Lisans

    İngilizce

    İngilizce

    2018

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. ŞULE ÖĞÜDÜCÜ

  2. Büyük veri analizi yöntemleri ve yazılım teknolojileriyle metin madenciliği

    Text mining using big data analysis methods and tools

    EVREN PALA

    Yüksek Lisans

    Türkçe

    Türkçe

    2016

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHava Harp Okulu Komutanlığı

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. GÜRAY YILMAZ

  3. Kısa metinlerde varlık ismi tanıma

    Named entity recognition on Turkish short texts

    BEYZA EKEN

    Yüksek Lisans

    Türkçe

    Türkçe

    2015

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. AHMET CÜNEYD TANTUĞ

  4. The effects of the use of learning management systems on writing motivation in an EFL context

    Öğrenme yönetim sistemleri kullanmanın yabancı dil olarak İngilizce yazma motivasyonu üzerindeki etkileri

    HATİCE GÜL SELÇUK

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Eğitim ve Öğretimİstanbul Medeniyet Üniversitesi

    Yabancı Diller Eğitimi Ana Bilim Dalı

    PROF. DR. SELAMİ AYDIN

  5. Informal learning, knowledge construction, and social media: The case of construction industry professionals

    Gayrı resmi eğitim, bilgi oluşumu ve sosyal medya: İnşaat uzmanları örneği

    RAMTİN ETEMADİ

    Yüksek Lisans

    İngilizce

    İngilizce

    2014

    İnşaat Mühendisliğiİstanbul Teknik Üniversitesi

    Mimarlık Ana Bilim Dalı

    DOÇ. DR. EMRAH ACAR