Geri Dön

Exploratory wrangling and annotation of tweets

Tweetler üzerinde işaretleme ve keşif amaçlı kümeleme

  1. Tez No: 459036
  2. Yazar: BERKAY DİNÇER
  3. Danışmanlar: PROF. DR. YÜCEL SAYGIN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2015
  8. Dil: İngilizce
  9. Üniversite: Sabancı Üniversitesi
  10. Enstitü: Mühendislik ve Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 54

Özet

Twitter her geçen gün daha da büyüyen, insanların fikir ve düşüncelerinin olduğu bir sosyal platform. Bu platformda her gün kullanıcılar tarafından üretilen içerik, verinin hacmi, düzensizliği ve hızı nedeniyle işlemesi çok zor bir veriye ama bir o kadar da değerli bir veriye dönüşmektedir. 2010 verilerine göre günde 55 milyon tweet üretilirken şu anda bu sayı ikiye katlanmıştır. Bu tezde twitter platformunda kullanıcılar tarafından üretilen verinin işlenebilmesi ve anlaşılabilmesi için sunduğumuz algoritmaları anlatıyor olacağız. Daha sonra bu algoritmaların tweetler üzerinde nasıl kullanılacağını, çalışmalardan ne gibi sonuçlar çıkarılabileceğini ve ne tür uygulamalar için fayda sağlayabileceğini gösteriyor olacağız. Bahsettiğimiz metodu kullanarak Twitter üzerinde“Robot”hesapları bulma ve tüm verinin özetini çok daha az tweet ile temsil edebilme gibi sorunları da nasıl çözdüğümüzü anlatıyor olacağız.

Özet (Çeviri)

Twitter is an ever growing social platform that is full of ideas and opinions. Huge amount of data is produced daily that is usually too cumbersome to process and mine for the opinions of individuals. As of 2010, 55 million tweets are sent daily and the number is doubled by now. Also twitter data is not structured as a text based information source, considering the lack of structure of the data along with its huge volume, it is nearly impossible to have a healthy summarization of all the ideas and opinions at real time. Therefore in this work we propose a set of algorithms to cluster relevant tweets and similar tweets talking about the same concept on twitter domain. We demonstrate and explain how this information can be used on tweets. As a side benefit we also use these algorithms to detect bots or spammer accounts on twitter since we place such tweets to the same clusters. We show that by transforming twitter data into a clustered structure we are able to overcome problems such as detecting bots and providing a neat summary of the data. these are solvable by transforming the unstructured data environment of twitter to a structured data environment by forming clusters and buckets over the data feed. Another interesting observation we made is that the clusters we form follow the Pareto principle therefore by inspecting only 20% of the clusters we can cover 80% of the whole data.

Benzer Tezler

  1. Çalışanların perspektifinden uzaktan çalışma üzerine keşifsel araştırma

    Exploratory research on remote working from the perspective of employees

    MUHAMMED FURKAN AYDOĞMUŞ

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    İşletmeDokuz Eylül Üniversitesi

    İşletme Ana Bilim Dalı

    DOÇ. DR. OYTUN BORAN SEZGİN

  2. Mikroservislerin keşifsel sınanması ve görselleştirilmesi

    Exploratory testing and visualization of microservices

    MUSTAFA BEDRİ EĞRİLMEZ

    Yüksek Lisans

    Türkçe

    Türkçe

    2020

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolYıldız Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ YUNUS EMRE SELÇUK

  3. Açımlayıcı Yapısal Eşitlik Modellemesinin (AYEM) incelenmesi ve farklı AYEM modellerinin karşılaştırılması

    Examining the Exploratory Structural Equation Modeling (ESEM) and comparing different ESEM models

    GİZEM CÖMERT

    Doktora

    Türkçe

    Türkçe

    2025

    Eğitim ve ÖğretimEge Üniversitesi

    Psikoloji Ana Bilim Dalı

    DOÇ. DR. MEDİHA KORKMAZ

  4. Yapay zeka tabanlı sohbet robotu sistemlerinin kullanışlılık algısına yönelik açımlayıcı faktör analizi:banka sektöründe bir vaka incelemesi

    Exploratory factor analysis on the perception of usefulness of artificial intelligence-based chatbot systems: a case study in the banking sector

    ÖMER CİHAN TABAK

    Yüksek Lisans

    Türkçe

    Türkçe

    2025

    Yönetim Bilişim Sistemleriİzmir Demokrasi Üniversitesi

    Yönetim Bilişim Sistemleri Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ORKUN YILDIZ

  5. Exploratory visualization model for measuring the digital divide in Asian and European countries

    Başlık çevirisi yok

    GH.JAİLLANİ TAKAMUL

    Yüksek Lisans

    İngilizce

    İngilizce

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHasan Kalyoncu Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ MOHAMMED K.M. MADI