Geri Dön

Tweet analizi için yapısal ve yapısal olmayan sistemlerin karşılaştırılması

Comparison of structural and unstructural systems for tweet analysis

  1. Tez No: 734949
  2. Yazar: TÜRKAN BAKUNOVA
  3. Danışmanlar: DR. ÖĞR. ÜYESİ ZİYA CİHAN TAYŞİ
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2022
  8. Dil: Türkçe
  9. Üniversite: Yıldız Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
  13. Sayfa Sayısı: 100

Özet

Günümüzde sosyal medya insanların etkileşim halinde oldukları bir alan oluşturmanın yanında çok farklı yan etkilere de sahiptir. Sayıları ve sağladıkları imkanlar giderek artan sosyal medya platformları, firmalar için oldukça önemli bir veri kaynağı haline gelmiştir. Bu ortamdan toplanan veri üzerinde yapılan analizler ile firmalar, müşteri kitlesini genişletmek, daha düşük maliyetlerle daha fazla satış elde edebilmek ve benzeri faydalar sağlamaktadırlar. Sosyal medya uygulamalarında üretilen veri, yapılan paylaşımların içeriksel analizi yanında güvenlik uygulamaları için de kullanılmaktadır. Bu uygulamalarda genellikle kişiler hakkında geçmişe dönük bilgi edinilmesi, paylaşılan bilginin kaynağının bulunması gibi konulara odaklanılmaktadır. Elde edilen bu bilgiler, sonraki süreçte yeni kararlar alınması ve strateji geliştirmesini sağlamaktadır. Sosyal medya analizi için kullanılacak sistemler belirlenirken genellikle iki temel kriter göz önüne alınmaktadır. Bu kriterlerden birincisi verinin toplanma hızı diğeri ise veri üzerinde yapılan analizlerin gerçekleştirilme hızıdır. Bu çalışma kapsamında yapısal ve yapısal olmayan veri tabanı sistemleri veri üzerinde gerçekleştirilen analizlerin hızı açısından değerlendirilmiştir. Çalışma kapsamında yapısal veri tabanı olarak Microsoft SQL Server, yapısal olmayan veri tabanı olarak ise Solr veri tabanları kullanılmıştır. Değerlendirme için hem Türkiye hem de Dünya'da oldukça popüler olan Twitter sosyal medya uygulamasının kullanılması tercih edilmiştir. Bu uygulama üzerinden iki aylık bir zaman dilimine ait 20 milyondan fazla paylaşım (tweet) toplanmıştır. Toplanan veri üzerinde yapılan incelemeler sonrasında çeşitli temizlik işlemleri de yapılarak verinin her iki veri tabanı sisteminde de saklanması için gerekli yapılar oluşturulmuştur. Toplanan paylaşımların analiz edilmesine yönelik olarak kelime tabanlı, kullanıcı tabanlı ve coğrafi tabanlı olmak üzere üç kategori altında 15 adet sorgu oluşturulmuştur. Sorgu performanlarının iyileştirilmesi için ilgili veri tabanlarının analiz araçları kullanılmış ve sorgular üzerinde çeşitli yapısal değişikliklere gidilerek sorgu performansları iyileştirilmiştir.

Özet (Çeviri)

Today, social media provides much more than creating a space for people to interact. Social media platforms, that has been evolving and providing more features to their users, have become one of the essential data sources for the companies. Analyses on this data provides several benefits such as expanding their business, reaching new customers, decreasing cost per sale, and more to companies. These data are also used as a valuable source for security applications, which mostly focus on collecting historical information about individuals and finding the source of the shared information. Information obtained by analyses on this data provides an opportunity to make further decisions and develop new strategies. There are two common fundamental criteria taken into account while determining the systems to be used in social media analysis. The first one is the rate of data collection and the other one is the time required to perform the analysis. In the scope of this study, structured and unstructured database systems were evaluated in terms of the execution speed of social media analysis. In order to perform comparison Microsoft SQL Server and Solr database systems were selected as structured and unstructured database systems respectively. Twitter social media platform, which is very popular both in Turkey and the World, is used. More than 20 million shares (in this case tweets) have been collected over a period of two months. After careful examination of the collected data, various cleaning processes were performed and the necessary structures were created to store the data in both database systems. In order to perform analysis 15 different queries were created under three categories, namely, word-based, user-based, and geographical-based. Analysis tools of the relevant databases were used to examine query performances, and then various structural changes performed in order to improve the performance.

Benzer Tezler

  1. Veri madenciliği teknikleri ile hava yolu firmalarının tweetleri üzerinden duygu analizi

    Sentiment analysis through tweet of airway companies with data mining techniques

    FATİH AYKUL

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBurdur Mehmet Akif Ersoy Üniversitesi

    Yönetim Bilişim Sistemleri Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ MELİKE ŞİŞECİ ÇEŞMELİ

  2. Türkçe metinlerde duygu analizi

    Sentiment analysis in Turkish texts

    CUMALİ TÜRKMENOĞLU

    Yüksek Lisans

    Türkçe

    Türkçe

    2015

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. AHMET CÜNEYD TANTUĞ

  3. Derin öğrenme yöntemleriyle sosyal medya analizi ve kullanıcı temsili

    Social media analysis and user representation with deep learning methods

    İBRAHİM RIZA HALLAÇ

    Doktora

    Türkçe

    Türkçe

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolFırat Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. GALİP AYDIN

  4. Twitter tabanlı duygu analizi

    Sentiment analysis based on twitter

    ABDULLAH TALHA KABAKUŞ

    Doktora

    Türkçe

    Türkçe

    2017

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolDüzce Üniversitesi

    Elektrik-Elektronik ve Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. RESUL KARA

  5. Fake news classification using machine learning and deep learning approaches

    Makine öğrenimi ve derin öğrenme yaklaşımlarını kullanarak sahte haber sınıflandırması

    SAJA ABDULHALEEM MAHMOOD AL-OBAIDI

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ TUBA ÇAĞLIKANTAR