Tweet analizi için yapısal ve yapısal olmayan sistemlerin karşılaştırılması
Comparison of structural and unstructural systems for tweet analysis
- Tez No: 734949
- Danışmanlar: DR. ÖĞR. ÜYESİ ZİYA CİHAN TAYŞİ
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2022
- Dil: Türkçe
- Üniversite: Yıldız Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
- Sayfa Sayısı: 100
Özet
Günümüzde sosyal medya insanların etkileşim halinde oldukları bir alan oluşturmanın yanında çok farklı yan etkilere de sahiptir. Sayıları ve sağladıkları imkanlar giderek artan sosyal medya platformları, firmalar için oldukça önemli bir veri kaynağı haline gelmiştir. Bu ortamdan toplanan veri üzerinde yapılan analizler ile firmalar, müşteri kitlesini genişletmek, daha düşük maliyetlerle daha fazla satış elde edebilmek ve benzeri faydalar sağlamaktadırlar. Sosyal medya uygulamalarında üretilen veri, yapılan paylaşımların içeriksel analizi yanında güvenlik uygulamaları için de kullanılmaktadır. Bu uygulamalarda genellikle kişiler hakkında geçmişe dönük bilgi edinilmesi, paylaşılan bilginin kaynağının bulunması gibi konulara odaklanılmaktadır. Elde edilen bu bilgiler, sonraki süreçte yeni kararlar alınması ve strateji geliştirmesini sağlamaktadır. Sosyal medya analizi için kullanılacak sistemler belirlenirken genellikle iki temel kriter göz önüne alınmaktadır. Bu kriterlerden birincisi verinin toplanma hızı diğeri ise veri üzerinde yapılan analizlerin gerçekleştirilme hızıdır. Bu çalışma kapsamında yapısal ve yapısal olmayan veri tabanı sistemleri veri üzerinde gerçekleştirilen analizlerin hızı açısından değerlendirilmiştir. Çalışma kapsamında yapısal veri tabanı olarak Microsoft SQL Server, yapısal olmayan veri tabanı olarak ise Solr veri tabanları kullanılmıştır. Değerlendirme için hem Türkiye hem de Dünya'da oldukça popüler olan Twitter sosyal medya uygulamasının kullanılması tercih edilmiştir. Bu uygulama üzerinden iki aylık bir zaman dilimine ait 20 milyondan fazla paylaşım (tweet) toplanmıştır. Toplanan veri üzerinde yapılan incelemeler sonrasında çeşitli temizlik işlemleri de yapılarak verinin her iki veri tabanı sisteminde de saklanması için gerekli yapılar oluşturulmuştur. Toplanan paylaşımların analiz edilmesine yönelik olarak kelime tabanlı, kullanıcı tabanlı ve coğrafi tabanlı olmak üzere üç kategori altında 15 adet sorgu oluşturulmuştur. Sorgu performanlarının iyileştirilmesi için ilgili veri tabanlarının analiz araçları kullanılmış ve sorgular üzerinde çeşitli yapısal değişikliklere gidilerek sorgu performansları iyileştirilmiştir.
Özet (Çeviri)
Today, social media provides much more than creating a space for people to interact. Social media platforms, that has been evolving and providing more features to their users, have become one of the essential data sources for the companies. Analyses on this data provides several benefits such as expanding their business, reaching new customers, decreasing cost per sale, and more to companies. These data are also used as a valuable source for security applications, which mostly focus on collecting historical information about individuals and finding the source of the shared information. Information obtained by analyses on this data provides an opportunity to make further decisions and develop new strategies. There are two common fundamental criteria taken into account while determining the systems to be used in social media analysis. The first one is the rate of data collection and the other one is the time required to perform the analysis. In the scope of this study, structured and unstructured database systems were evaluated in terms of the execution speed of social media analysis. In order to perform comparison Microsoft SQL Server and Solr database systems were selected as structured and unstructured database systems respectively. Twitter social media platform, which is very popular both in Turkey and the World, is used. More than 20 million shares (in this case tweets) have been collected over a period of two months. After careful examination of the collected data, various cleaning processes were performed and the necessary structures were created to store the data in both database systems. In order to perform analysis 15 different queries were created under three categories, namely, word-based, user-based, and geographical-based. Analysis tools of the relevant databases were used to examine query performances, and then various structural changes performed in order to improve the performance.
Benzer Tezler
- Veri madenciliği teknikleri ile hava yolu firmalarının tweetleri üzerinden duygu analizi
Sentiment analysis through tweet of airway companies with data mining techniques
FATİH AYKUL
Yüksek Lisans
Türkçe
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBurdur Mehmet Akif Ersoy ÜniversitesiYönetim Bilişim Sistemleri Ana Bilim Dalı
DR. ÖĞR. ÜYESİ MELİKE ŞİŞECİ ÇEŞMELİ
- Türkçe metinlerde duygu analizi
Sentiment analysis in Turkish texts
CUMALİ TÜRKMENOĞLU
Yüksek Lisans
Türkçe
2015
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. AHMET CÜNEYD TANTUĞ
- Derin öğrenme yöntemleriyle sosyal medya analizi ve kullanıcı temsili
Social media analysis and user representation with deep learning methods
İBRAHİM RIZA HALLAÇ
Doktora
Türkçe
2021
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolFırat ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. GALİP AYDIN
- Twitter tabanlı duygu analizi
Sentiment analysis based on twitter
ABDULLAH TALHA KABAKUŞ
Doktora
Türkçe
2017
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolDüzce ÜniversitesiElektrik-Elektronik ve Bilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. RESUL KARA
- Fake news classification using machine learning and deep learning approaches
Makine öğrenimi ve derin öğrenme yaklaşımlarını kullanarak sahte haber sınıflandırması
SAJA ABDULHALEEM MAHMOOD AL-OBAIDI
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ TUBA ÇAĞLIKANTAR