Geri Dön

Metin madenciliği teknikleri ile sosyal medya gönderilerinin analiz edilmesi: ankilozan spondilit hastalığı örneği

Analysis of social media posts with text mining techniques the case of ankylosing spondylitis disease

  1. Tez No: 562222
  2. Yazar: ERTUĞRUL GÜMÜŞSU
  3. Danışmanlar: DR. ÖĞR. ÜYESİ NACİ MURAT
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilim ve Teknoloji, Science and Technology
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2019
  8. Dil: Türkçe
  9. Üniversite: Ondokuz Mayıs Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Akıllı Sistemler Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 250

Özet

Teknoloji kullanımın her geçen gün artması ile birlikte sosyal medya ve internet kullanımı hızla yaygınlaşmaktadır. Özellikle sosyal medya kullananların sayısının artmasıyla insanlar duygu ve düşüncelerini, gündemle ilgili görüş ve fikirlerini sosyal medya araçlarını kullanarak paylaşmaktadır. En çok kullanılan sosyal medya araçlarından biri olan Facebook gibi sosyal ağ uygulamalarında milyonlarca içerik paylaşılmaktadır. Paylaşılan bu içerikler yapısal olmayan veri türleridir. Bu yapısal olmayan verilerden anlamlı bilgilerin elde edilebilmesi ve çeşitli analizlerin yapılabilmesi için yapısal hale dönüştürülmesi gerekmektedir. Yapısal olmayan metin içerikli verilerin yapısal hale dönüştürülmesinde ve analiz edilmesinde metin madenciliği yöntemleri kullanılmaktadır. Bu çalışmada Facebook'ta yer alan“Ankilozan Spondilit Hasta Derneği”grubunda Ankilozan Spondilit hastaları tarafından paylaşılan metinsel içerikler metin madenciliği yöntemleri kullanılarak analiz edilmiştir. Farklı kategoriler altında veriler toplanmıştır. Ağırlıklandırma yöntemleri olarak terim frekansı, ikili ağırlıklandırma ve TFxIDF (Terim frekansı x Ters metin frekansı) ağırlıklandırma yöntemleri kullanılmıştır. Sınıflandırma işlemleri için K-en yakın komşu, SMO (Sequential minimal optimization), karar ağaçları ve Naive Bayes algoritması kullanılmıştır. Terim ağırlıklandırma yöntemlerine göre sınıflandırma algoritmalarının başarı oranları ölçülmüştür. En başarılı sonuç %53,33 doğruluk oranı ile ikili ağırlıklandırma yönteminde SMO algoritmasının sağladığı gözlenmiştir. Her kategoriyi temsil edecek anlamlı bilgi çıkarımları yapılmış ve bilgi çıkarımları çeşitli görsel grafikler ile sunulmuştur. Kategorilere ait ikili ve üzeri kelime kullanımlarını tespit etmek amacıyla birliktelik analizi yapılmıştır. Birliktelik analizi işlemlerinde Apriori algoritması uygulanmış ve sonuçlar çizelgeler halinde verilmiştir. Kategorileri temsil eden anahtar kelimelerin yıllara göre farklılık gösterdiği tespit edilmiştir. Kategorilere ait anahtar kelimeleri göstermek amacıyla kelime bulutları oluşturulmuştur.

Özet (Çeviri)

With the increasing use of technology, social media and internet usage is rapidly widespread. Especially with the increase in the number of social media users, people share their feelings and thoughts, opinions and ideas about the agenda by using social media tools. Millions of content are shared in social networking applications such as Facebook, one of the most widely used social media tools. These shared contents are non-structural data types. It is necessary to extract meaningful information from these non-structural data and to be transformed into a structural format in order to make various analyzes. Text mining methods are used for the transformation and analysis of non-structural text-based data. In this study, the textual contents shared by patients with Ankylosing Spondylitis in“The Ankylosing Spondylitis Patient Association”group on Facebook were analyzed by using text mining methods. Data was collected under different categories. Term frequency, binary weighting and TFxIDF (Term frequency x Inverse document frequency) weighting methods were used as weighting methods. K-nearest neighbors, SMO (Sequential minimal optimization), decision trees and Naive Bayes algorithm were used for classification operations. Performance ratios of classification algorithms were measured according to the term weighting methods. The most successful result was obtained by SMO algorithm in binary weighting method with an accuracy rate of 53.33%. Significant information extractions to represent each category were made and the these were presented with various visual graphs. An association analysis was performed to determine binary and above word usage of the categories. Apriori algorithm was applied in association analysis and the results were given as tables. It has been found that the keywords representing the categories differ according to years. Word clouds have been created to show the keywords belonging to the categories.

Benzer Tezler

  1. Kısa metinlerden sosyal duygu sınıflandırma için makine öğrenmesi tabanlı yöntemlerin geliştirilmesi

    Development of machine learning based methods for social sentiment classification from brief texts

    FATMA BAŞKAYA

    Yüksek Lisans

    Türkçe

    Türkçe

    2017

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolFırat Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. İLHAN AYDIN

  2. Duygu analizi ve metin madenciliği yöntemleriyle hizmet kalitesi ölçüm modeli önerisi: Ankara Büyükşehir Belediyesi örneği

    Service quality measurement model proposal using sentiment analysis and text mining methods: The case of Ankara Metropolitan Municipality

    ERHAN SUR

    Doktora

    Türkçe

    Türkçe

    2024

    Yönetim Bilişim SistemleriGazi Üniversitesi

    Yönetim Bilişim Sistemleri Ana Bilim Dalı

    DOÇ. DR. HÜSEYİN ÇAKIR

  3. Metin madenciliği teknikleri ile sosyal ağlarda bilgi keşfi

    Knowledge discovery in social networks using text mining techniques

    FATMA GÜLŞAH TAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2018

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSüleyman Demirel Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. ASIM SİNAN YÜKSEL

  4. Tip 2 diyabet hastalığına ilişkin haberlerin metin madenciliği yöntemi ile incelenmesi

    Analyzing the news on type 2 diabetes by text mining method

    SEMA DÖKME YAĞAR

    Doktora

    Türkçe

    Türkçe

    2022

    Sağlık Kurumları YönetimiAnkara Üniversitesi

    Sağlık Kurumları Yönetimi Ana Bilim Dalı

    DOÇ. DR. ÇAĞDAŞ ERKAN AKYÜREK

  5. Analysis of opinion leaders using text mining techniques on social media

    Metin madenciliği teknikleri kullanılarak sosyal medya verileri ile kanaat önderlerinin analizi

    KALOMA USMAN MAJIKUMNA

    Yüksek Lisans

    İngilizce

    İngilizce

    2016

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolFırat Üniversitesi

    Yazılım Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. MUSTAFA ULAŞ