Geri Dön

Bir sosyal ağdan alınan verilerin anlamsal kutuplandırılması

Semanticaly polarizing data from a social network

  1. Tez No: 522272
  2. Yazar: DİLBER ÇETİNTAŞ
  3. Danışmanlar: DOÇ. DR. TANER TUNCER
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2018
  8. Dil: Türkçe
  9. Üniversite: Fırat Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 60

Özet

Bu tez çalışmasında twitter kullanıcılarının atmış olduğu tweetlerden yararlanarak internet üzerinde dolaşan kirli ve düzensiz bilginin daha elveririşli hale getirilmesi amaçlanıştır. Günümüzde sosyal ağ kullanımının artması ve kullanıcıların yoğun talep göstermesi paylaşılan içeriklerin kontrolünü gündeme getirmiştir. Kötü niyetli kişilerin algı yönetimi, provakasyon, sahtekarlık amaçlı metinlerin önüne geçilmesi mevcut verileri sınıflandırma fikrini ortaya çıkarmıştır. Sınıflandırmadan kasıt verinin toplumun etik değerleri, dil ve lehçe göz önüne alınarak anlamsal olarak olumlu, olumsuz, nötr olarak belirtilmesidir. Bu yüzden analiz amaçlı NodeXL ile Twitter üzerinden alınan datalar gereksiz kelime ve noktalama işaretlerinden arındırılmış, yanlış yazımlar, lehçe farklılıkları elimine edilmiştir. Yapılandırma aşamasından sonra tweetler daha doğru sonuçlar alınabilmesi adına herbir tweet beş farklı gönüllü tarafından olumlu, olumsuz, nötr olarak etiketlenip sayı değeri yüksek olan etiket değeri sonuç olarak kabul edilmiştir. Hazırlanan data seti knime programı yardımıyla kullanılan kelime sıklığına göre özellik vektörleri oluşturulup 70'a 30 oranında öğrenme ve tahmin grupları DVM(Destek Vektör Makineleri), Naive Bayes, Karar Ağaçları algoritmalarıyla sınıflandırılmıştır. Son aşamada ise ağ ilişkilerinin anlam üzerindeki etkisi araştırılmıştır.

Özet (Çeviri)

In this thesis, it is aimed to make dirty and irregular information circulating on the internet more convenient by taking advantage of the tweets that twitter users have taken. Increasing use of social networking today and the intensive demand of users have brought about the control of shared content. Prevention of malicious people 's perception management, provocation, fraudulent texts reveals the idea of classifying existing data. The notion of classification is that the ethical values of the community are to be semantically positive, negative, neutral, taking into account language and dialect. Therefore, NodeXL for analysis and data received via Twitter are eliminated from unnecessary words and punctuation, misspellings, polish differences have been eliminated. After the configuration phase, the tweet was tagged as positive, negative, neutral by five different volunteers each tweet in order to get more accurate results, and the tag value with high number was accepted as the result. The prepared data set is created by feature vectors according to the word frequency used with the help of the knime program, and the learning and estimation groups of 70 to 30 are classified by SVM (Support Vevtor Machine), Decision Tree and Naive Bayes algorithms.

Benzer Tezler

  1. Derin öğrenme ve büyük veri analitiği yöntemleriKullanarak Covid-19 yayılımının ileriye dönük tahmini

    Forecasting the spread of covid-19 using deep learning and big data analytics methods

    CYLAS KIGANDA

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi Üniversitesi

    Bilgisayar Bilimleri Ana Bilim Dalı

    PROF. DR. MUHAMMET ALİ AKCAYOL

  2. Ortaöğretim öğrencilerinin sosyal medyaya ilişkin tutumlarının belirlenmesi (Araklı örneği)

    Postgraduate thesis on analysis of high school students' attitudes towards social media (Example of Araklı)

    ÖZLEM KILIÇ

    Yüksek Lisans

    Türkçe

    Türkçe

    2016

    Eğitim ve ÖğretimCumhuriyet Üniversitesi

    Ortaöğretim Sosyal Alanlar Eğitimi Ana Bilim Dalı

    DOÇ. DR. RECEP ERCAN

  3. The social capital of nascent entrepreneurs: A qualitative case study design

    Yeni girişicimlerin sosyal sermayeleri üzerine nitel bir vaka çalışması

    BERİL GÜL

    Yüksek Lisans

    İngilizce

    İngilizce

    2018

    İşletmeİstanbul Teknik Üniversitesi

    İşletme Mühendisliği Ana Bilim Dalı

    PROF. DR. FATMA KÜSKÜ AKDOĞAN

  4. Yapıların uyarlanabilir yeniden kullanımı: Konya otogar binası için analizler

    Adaptive reuse of buildings: Analysis for Konya bus station building

    HARUN GÜL

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    MimarlıkNecmettin Erbakan Üniversitesi

    Mimarlık Ana Bilim Dalı

    PROF. DR. DİCLE AYDIN

  5. Kesikli yaşam süresi modelleri

    Discrete time survival models

    HİLAL ÖLMEZ

    Yüksek Lisans

    Türkçe

    Türkçe

    2016

    İstatistikHacettepe Üniversitesi

    İstatistik Ana Bilim Dalı

    DOÇ. DR. NİHAL ATA TUTKUN