Bir sosyal ağdan alınan verilerin anlamsal kutuplandırılması
Semanticaly polarizing data from a social network
- Tez No: 522272
- Danışmanlar: DOÇ. DR. TANER TUNCER
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2018
- Dil: Türkçe
- Üniversite: Fırat Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 60
Özet
Bu tez çalışmasında twitter kullanıcılarının atmış olduğu tweetlerden yararlanarak internet üzerinde dolaşan kirli ve düzensiz bilginin daha elveririşli hale getirilmesi amaçlanıştır. Günümüzde sosyal ağ kullanımının artması ve kullanıcıların yoğun talep göstermesi paylaşılan içeriklerin kontrolünü gündeme getirmiştir. Kötü niyetli kişilerin algı yönetimi, provakasyon, sahtekarlık amaçlı metinlerin önüne geçilmesi mevcut verileri sınıflandırma fikrini ortaya çıkarmıştır. Sınıflandırmadan kasıt verinin toplumun etik değerleri, dil ve lehçe göz önüne alınarak anlamsal olarak olumlu, olumsuz, nötr olarak belirtilmesidir. Bu yüzden analiz amaçlı NodeXL ile Twitter üzerinden alınan datalar gereksiz kelime ve noktalama işaretlerinden arındırılmış, yanlış yazımlar, lehçe farklılıkları elimine edilmiştir. Yapılandırma aşamasından sonra tweetler daha doğru sonuçlar alınabilmesi adına herbir tweet beş farklı gönüllü tarafından olumlu, olumsuz, nötr olarak etiketlenip sayı değeri yüksek olan etiket değeri sonuç olarak kabul edilmiştir. Hazırlanan data seti knime programı yardımıyla kullanılan kelime sıklığına göre özellik vektörleri oluşturulup 70'a 30 oranında öğrenme ve tahmin grupları DVM(Destek Vektör Makineleri), Naive Bayes, Karar Ağaçları algoritmalarıyla sınıflandırılmıştır. Son aşamada ise ağ ilişkilerinin anlam üzerindeki etkisi araştırılmıştır.
Özet (Çeviri)
In this thesis, it is aimed to make dirty and irregular information circulating on the internet more convenient by taking advantage of the tweets that twitter users have taken. Increasing use of social networking today and the intensive demand of users have brought about the control of shared content. Prevention of malicious people 's perception management, provocation, fraudulent texts reveals the idea of classifying existing data. The notion of classification is that the ethical values of the community are to be semantically positive, negative, neutral, taking into account language and dialect. Therefore, NodeXL for analysis and data received via Twitter are eliminated from unnecessary words and punctuation, misspellings, polish differences have been eliminated. After the configuration phase, the tweet was tagged as positive, negative, neutral by five different volunteers each tweet in order to get more accurate results, and the tag value with high number was accepted as the result. The prepared data set is created by feature vectors according to the word frequency used with the help of the knime program, and the learning and estimation groups of 70 to 30 are classified by SVM (Support Vevtor Machine), Decision Tree and Naive Bayes algorithms.
Benzer Tezler
- Derin öğrenme ve büyük veri analitiği yöntemleriKullanarak Covid-19 yayılımının ileriye dönük tahmini
Forecasting the spread of covid-19 using deep learning and big data analytics methods
CYLAS KIGANDA
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi ÜniversitesiBilgisayar Bilimleri Ana Bilim Dalı
PROF. DR. MUHAMMET ALİ AKCAYOL
- Ortaöğretim öğrencilerinin sosyal medyaya ilişkin tutumlarının belirlenmesi (Araklı örneği)
Postgraduate thesis on analysis of high school students' attitudes towards social media (Example of Araklı)
ÖZLEM KILIÇ
Yüksek Lisans
Türkçe
2016
Eğitim ve ÖğretimCumhuriyet ÜniversitesiOrtaöğretim Sosyal Alanlar Eğitimi Ana Bilim Dalı
DOÇ. DR. RECEP ERCAN
- The social capital of nascent entrepreneurs: A qualitative case study design
Yeni girişicimlerin sosyal sermayeleri üzerine nitel bir vaka çalışması
BERİL GÜL
Yüksek Lisans
İngilizce
2018
İşletmeİstanbul Teknik Üniversitesiİşletme Mühendisliği Ana Bilim Dalı
PROF. DR. FATMA KÜSKÜ AKDOĞAN
- Yapıların uyarlanabilir yeniden kullanımı: Konya otogar binası için analizler
Adaptive reuse of buildings: Analysis for Konya bus station building
HARUN GÜL
Yüksek Lisans
Türkçe
2023
MimarlıkNecmettin Erbakan ÜniversitesiMimarlık Ana Bilim Dalı
PROF. DR. DİCLE AYDIN
- Kesikli yaşam süresi modelleri
Discrete time survival models
HİLAL ÖLMEZ
Yüksek Lisans
Türkçe
2016
İstatistikHacettepe Üniversitesiİstatistik Ana Bilim Dalı
DOÇ. DR. NİHAL ATA TUTKUN