Geri Dön

Mikrobloglarda içerik madenciliği

Content mining of microblogs

  1. Tez No: 316013
  2. Yazar: MUSTAFA ÖZGÜR CİNGİZ
  3. Danışmanlar: DOÇ. DR. BANU DİRİ
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2012
  8. Dil: Türkçe
  9. Üniversite: Yıldız Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 106

Özet

Web 2.0 ile birlikte kullanıcılar sosyal ağlarda ilgi alanlarını, düşüncelerini, başka kullanıcıların yazılarını veya gündelik aktivitelerini takipçileriyle paylaşabilmektedir. Kullanıcılar paylaştıkları içeriklerle birbirleriyle etkileşim içerisindedir. Sosyal ağların alt uygulama alanı olan mikroblog uygulamalarının en popüler olanı Twitter'dır. Twitter kullanımı son yıllarda oldukça popüler olmasından dolayı Twitter üzerindeki büyük ölçekte işlenmemiş veri bulunmaktadır. Mikrobloglar üzerine yapılan çalışmalar genellikle değerli içerik giren kullanıcıların belirlenmesi ve kullanıcıların kategorizasyonuyla ilgili çalışmalardır.Tez kapsamında amacımız kategori bilgileri wefollow.com uygulamasıyla elde edilmiş haber içeriği giren kullanıcıların ve normal kullanıcıların içeriklerinin kategorilerini ne ölçüde temsil ettiğini belirlenmektir. Sistem eğitim ve test aşamasından oluşmaktadır. Eğitim verisi olarak ekonomi, spor, teknoloji ve eğlence kategorilerine ait 3337 haber RSS haber beslemesi kategori kullanılmıştır. Test aşamasında ise normal kullanıcı ve haber içeriği giren kullanıcıların içerikleri (tvitleri) test verisi olarak kullanılmıştır.Benzer çalışmalardan farklı olarak Twitter kullanıcılarının içeriklerine ait özellikler RSS haber beslemelerinde yer aldığı takdirde içerik özelliği olarak alınmış, aksi durumda özellikler değerlendirmeye katılmamıştır. Sadece eğitim aşamasında elde edilen özelliklerin test verisi olarak kullanılan kullanıcı içeriklerinde aranmasıyla mikrobloglarda karakter sınırı yüzünden çokça kullanılan anlamsız kısaltma ve kelimelerin elenmesi amaçlanmıştır.Performans değerlendirme sonuçlarına göre haber içeriği giren kullanıcıların (botlar) içerikleri normal kullanıcı içeriklerine oranla daha başarılı kategorize edildiği gözlemlenmiştir. Aynı zamanda hem normal kullanıcı hem de haber içeriği giren kullanıcılarından en başarılı sınıflandırma sonuçları spor alanında içerik giren kullanıcılarından en başarısız sınıflandırma sonuçları ise teknoloji alanında içerik giren kullanıcılardan elde edilmiştir.Öngörülen sistem aynı zamanda eğitim ve test aşamasında sadece tvitlerin kullanıldığı modelle de karşılaştırılmıştır. Sınıflandırma performans sonuçlarına göre öngörülen sistemin başarı oranları sadece kullanıcı içerikleri kullanılarak oluşturulmuş sistemin başarı oranlarından yüksek çıkmıştır.

Özet (Çeviri)

Emergence of Web 2.0, internet users can share their contents with other users using social networks. Microblogs are an sub area of social networks. Twitter is a popular application that people share their contents which are called as tweet with each other. Users generally follow microbloggers according to their field of interest. Followers expect from other users who are followed by followers to share their contents which reflect follower?s field of interest.In this work unprocessed data on microblogs are evaluated with respect to how they reflect their categories. Migrobloggers? category information, which is one of the four categories that are economy sport, entertainment or technology, is taken from wefollow.com application. 3337 RSS news feeds, whose category labels are same with microbloggers? contributions, are used as training data for classification. Unlike the similar studies if a feature of microblog doesn?t appear in RSS news feeds as a feature, this feature is omitted so abbreviations and nonsense words in microblogs can be eliminated.In this study two types of users? contributions are taken as test data. These users are normal microbloggers and bots. Classification results show that bots provide more categorical content than normal users. However, normal users and bot users whose categorical information is sport classification of content performance are better than other users who provide content about other three categories. The worst classification performance is obtained from users whose categorical information is technology.Our proposed modal is also compared the modal which uses only tweets, which are also used in proposed modal, in training and testing phases. Proposed modal gives better classification performance than the modal which uses only tweets in training and testing phases.

Benzer Tezler

  1. Dijital medyada fanatizm: futbola ilişkin sosyal ağlarda nefret söylemi

    Fanaticism on digital media: hate speech related to football on social networks

    MERVE APSAR GÜZELKOKAR

    Yüksek Lisans

    Türkçe

    Türkçe

    2014

    Radyo-TelevizyonGalatasaray Üniversitesi

    Radyo Televizyon ve Sinema Ana Bilim Dalı

    DOÇ. DR. ÖZLEM DANACI YÜCE

  2. Sosyal medyada içeriğin yayılımı ve kullanıcıların paylaşım motivasyonları: Türkiye'de Twitter kullanıcılarının retweet pratiği üzerine bir araştırma

    User generated content diffusion in social media and users' sharing motivations: A research on Twitter users' retweet practice in Turkey

    BURAK POLAT

    Doktora

    Türkçe

    Türkçe

    2021

    GazetecilikMarmara Üniversitesi

    Gazetecilik Ana Bilim Dalı

    PROF. DR. NECMİ EMEL DİLMEN

  3. An analysis of news on microblogging systems

    Mikroblog sistemlerinde haber analizi

    OKAY ASLAN

    Yüksek Lisans

    İngilizce

    İngilizce

    2010

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. SUZAN ÜSKÜDARLI

  4. Sosyal medya reklamcılığındaki gelişmeler ve ınstagram reklamcılığının genç tüketiciler üzerindeki etkileri: Bölgesel bir araştırma

    Developments in social media advertising and the effects of instagram advertising on young consumers: A regional research

    METİN OKUTAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    ReklamcılıkKTO Karatay Üniversitesi

    İşletme Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ AHMET ÇALIK

  5. Sosyal medyanın tüketici davranışları üzerine etkisi: Bakü örnekli bir uygulama

    The effect of social media on consumer behavior: An application with Bakü

    JEYHUN ISLAMOV

    Yüksek Lisans

    Türkçe

    Türkçe

    2022

    İşletmeSelçuk Üniversitesi

    İşletme Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ GÖKHAN AKANDERE