Metin madenciliği teknikleri ile sosyal medya gönderilerinin analiz edilmesi: ankilozan spondilit hastalığı örneği
Analysis of social media posts with text mining techniques the case of ankylosing spondylitis disease
- Tez No: 562222
- Danışmanlar: DR. ÖĞR. ÜYESİ NACİ MURAT
- Tez Türü: Yüksek Lisans
- Konular: Bilim ve Teknoloji, Science and Technology
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2019
- Dil: Türkçe
- Üniversite: Ondokuz Mayıs Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Akıllı Sistemler Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 250
Özet
Teknoloji kullanımın her geçen gün artması ile birlikte sosyal medya ve internet kullanımı hızla yaygınlaşmaktadır. Özellikle sosyal medya kullananların sayısının artmasıyla insanlar duygu ve düşüncelerini, gündemle ilgili görüş ve fikirlerini sosyal medya araçlarını kullanarak paylaşmaktadır. En çok kullanılan sosyal medya araçlarından biri olan Facebook gibi sosyal ağ uygulamalarında milyonlarca içerik paylaşılmaktadır. Paylaşılan bu içerikler yapısal olmayan veri türleridir. Bu yapısal olmayan verilerden anlamlı bilgilerin elde edilebilmesi ve çeşitli analizlerin yapılabilmesi için yapısal hale dönüştürülmesi gerekmektedir. Yapısal olmayan metin içerikli verilerin yapısal hale dönüştürülmesinde ve analiz edilmesinde metin madenciliği yöntemleri kullanılmaktadır. Bu çalışmada Facebook'ta yer alan“Ankilozan Spondilit Hasta Derneği”grubunda Ankilozan Spondilit hastaları tarafından paylaşılan metinsel içerikler metin madenciliği yöntemleri kullanılarak analiz edilmiştir. Farklı kategoriler altında veriler toplanmıştır. Ağırlıklandırma yöntemleri olarak terim frekansı, ikili ağırlıklandırma ve TFxIDF (Terim frekansı x Ters metin frekansı) ağırlıklandırma yöntemleri kullanılmıştır. Sınıflandırma işlemleri için K-en yakın komşu, SMO (Sequential minimal optimization), karar ağaçları ve Naive Bayes algoritması kullanılmıştır. Terim ağırlıklandırma yöntemlerine göre sınıflandırma algoritmalarının başarı oranları ölçülmüştür. En başarılı sonuç %53,33 doğruluk oranı ile ikili ağırlıklandırma yönteminde SMO algoritmasının sağladığı gözlenmiştir. Her kategoriyi temsil edecek anlamlı bilgi çıkarımları yapılmış ve bilgi çıkarımları çeşitli görsel grafikler ile sunulmuştur. Kategorilere ait ikili ve üzeri kelime kullanımlarını tespit etmek amacıyla birliktelik analizi yapılmıştır. Birliktelik analizi işlemlerinde Apriori algoritması uygulanmış ve sonuçlar çizelgeler halinde verilmiştir. Kategorileri temsil eden anahtar kelimelerin yıllara göre farklılık gösterdiği tespit edilmiştir. Kategorilere ait anahtar kelimeleri göstermek amacıyla kelime bulutları oluşturulmuştur.
Özet (Çeviri)
With the increasing use of technology, social media and internet usage is rapidly widespread. Especially with the increase in the number of social media users, people share their feelings and thoughts, opinions and ideas about the agenda by using social media tools. Millions of content are shared in social networking applications such as Facebook, one of the most widely used social media tools. These shared contents are non-structural data types. It is necessary to extract meaningful information from these non-structural data and to be transformed into a structural format in order to make various analyzes. Text mining methods are used for the transformation and analysis of non-structural text-based data. In this study, the textual contents shared by patients with Ankylosing Spondylitis in“The Ankylosing Spondylitis Patient Association”group on Facebook were analyzed by using text mining methods. Data was collected under different categories. Term frequency, binary weighting and TFxIDF (Term frequency x Inverse document frequency) weighting methods were used as weighting methods. K-nearest neighbors, SMO (Sequential minimal optimization), decision trees and Naive Bayes algorithm were used for classification operations. Performance ratios of classification algorithms were measured according to the term weighting methods. The most successful result was obtained by SMO algorithm in binary weighting method with an accuracy rate of 53.33%. Significant information extractions to represent each category were made and the these were presented with various visual graphs. An association analysis was performed to determine binary and above word usage of the categories. Apriori algorithm was applied in association analysis and the results were given as tables. It has been found that the keywords representing the categories differ according to years. Word clouds have been created to show the keywords belonging to the categories.
Benzer Tezler
- Kısa metinlerden sosyal duygu sınıflandırma için makine öğrenmesi tabanlı yöntemlerin geliştirilmesi
Development of machine learning based methods for social sentiment classification from brief texts
FATMA BAŞKAYA
Yüksek Lisans
Türkçe
2017
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolFırat ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. İLHAN AYDIN
- Duygu analizi ve metin madenciliği yöntemleriyle hizmet kalitesi ölçüm modeli önerisi: Ankara Büyükşehir Belediyesi örneği
Service quality measurement model proposal using sentiment analysis and text mining methods: The case of Ankara Metropolitan Municipality
ERHAN SUR
Doktora
Türkçe
2024
Yönetim Bilişim SistemleriGazi ÜniversitesiYönetim Bilişim Sistemleri Ana Bilim Dalı
DOÇ. DR. HÜSEYİN ÇAKIR
- Metin madenciliği teknikleri ile sosyal ağlarda bilgi keşfi
Knowledge discovery in social networks using text mining techniques
FATMA GÜLŞAH TAN
Yüksek Lisans
Türkçe
2018
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSüleyman Demirel ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. ASIM SİNAN YÜKSEL
- Tip 2 diyabet hastalığına ilişkin haberlerin metin madenciliği yöntemi ile incelenmesi
Analyzing the news on type 2 diabetes by text mining method
SEMA DÖKME YAĞAR
Doktora
Türkçe
2022
Sağlık Kurumları YönetimiAnkara ÜniversitesiSağlık Kurumları Yönetimi Ana Bilim Dalı
DOÇ. DR. ÇAĞDAŞ ERKAN AKYÜREK
- Analysis of opinion leaders using text mining techniques on social media
Metin madenciliği teknikleri kullanılarak sosyal medya verileri ile kanaat önderlerinin analizi
KALOMA USMAN MAJIKUMNA
Yüksek Lisans
İngilizce
2016
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolFırat ÜniversitesiYazılım Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. MUSTAFA ULAŞ