Geri Dön

Spam detection by using network and text embedding approaches

Sosyal ağ analizi ve metin madenciliği kullanarak yanıltıcı yorumları tespit etme

  1. Tez No: 599755
  2. Yazar: CENNET MERVE YILMAZ
  3. Danışmanlar: DOÇ. DR. CEM İYİGÜN, DR. ÖĞR. ÜYESİ AHMET ONUR DURAHİM
  4. Tez Türü: Yüksek Lisans
  5. Konular: Endüstri ve Endüstri Mühendisliği, Industrial and Industrial Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2019
  8. Dil: İngilizce
  9. Üniversite: Orta Doğu Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Endüstri Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 105

Özet

Siber ortama yayılmış bilgilerin doğruluğu ve tutarlı olmasının önemi her gecen gün daha da önemli hale gelmektedir. Potansiyel müşterilerin satın alma işlemleri öncesinde müşteri yorumlarını ve önerilerini internet üzerinden görüntüleyebilir olması, bilgi tutarlığının önemini özellikle e-ticaret (sanal ticaret) alanında daha da arttırmaktadır. Günümüzde bilginin bu kadar kolay erişilebilir olmasının yanında, ulaşılan bilginin doğruluğuyla ilgili kontrollerin yetersiz oluşu, bu bilginin güvenilir olup olmadığıyla ilgili kaygılar oluşturmaktadır. Ayrıca, hileli kullanıcılar spam(istenmeyen) bilgiler paylaşarak insanları yanlış yönlendirmektedir. Bu sebeplerle, güvenlik araştırmacıları tarafından hatalı ya da yanlış kullanıcı yorumlarının denetlenmesi kritik bir problem haline dönüşmüştür. Bu çalışmada, DocRep, NodeRep ve SPR2EP yaklaşımlarıyla spam kullanıcı yorumlarını analiz ettik ve bu yaklaşımların farklarını inceledik. Çalışmamız için kullanıcı yorum metinlerinden ve sosyal ağ bağlantı bilgilerinden yararlandık. Kullandığımız yöntemler, yorum metinlerinden elde edilen bilgi ve kullanıcı – ürün ağ yapısı bilgisini birleştirmektedir. Kullanıcıların, yazdıkları yorumlar ve yorumladıkları ürün arasında makine öğrenmesi algoritmaları kullanılarak, her yorum, kullanıcı ve ürün için, bu birleşenlerin özelliklerini yansıtan vektörler oluşturuldu ve oluşturulan bu vektörler kullanıcı yorumlarının spam olup olmadığını belirlemek için sınıflandırıcı algoritmaların girdisi olarak kullanıldı. Yapılan karşılaştırmalı çalışma neticesinde, sadece sosyal ağlardan yararlanan yaklaşım kullanıcı yorumu verişinde diğer yaklaşımlara göre daha yüksek performans elde edilmiştir

Özet (Çeviri)

Authenticity and reliability of the information spread over the cyberspace is becoming increasingly important, especially in e-commerce. This is because potential customers check reviews and customer feedbacks online before making a purchasing decision. Although this information is easily accessible through related websites, lack of verification of the authenticity of these reviews raises concerns about their reliability. Besides, fraudulent users disseminate disinformation to deceive people into acting against their interest. So, detection of fake and unreliable reviews is a crucial problem that must be addressed. In this study, we analyze and compare three different spam review detection approaches, DocRep, NodeRep and SPR2EP, that utilize review text only, network information only and the one that is proposed in this study that incorporates knowledge extracted from the textual content of the reviews with information obtained by exploiting the underlying reviewer-product network structure, respectively. One of the important contributions of this study is the proposed framework, SPR2EP, is that it benefits from both review text and network information. In SPR2EP approach, first, feature vectors are learned for each review, reviewer and product by utilizing state-of-the-art algorithms developed for learning document and node embeddings, and then these are fed into a classifier to identify opinion spam. It minimizes the feature engineering effort. The effectiveness of our framework approaches that utilize network embeddings over existing techniques on detecting spam reviews is demonstrated in three different data sets containing online reviews.

Benzer Tezler

  1. Doğal dil işleme tekniklerini ve derin öğrenme algoritmalarını kullanarak sosyal ağlarda spam tespiti

    Using natural language processing techniques and deep learning algorithms for detecting spam on social networks

    REZAN BAKIR

    Doktora

    Türkçe

    Türkçe

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKırıkkale Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. HASAN ERBAY

  2. Sosyal ağlara yönelik öğrenmeye dayalı bir spam hesap tespit modeli ve uygulaması

    A spam account detection model based on learning and its application for social networks

    OĞUZHAN ÇITLAK

    Yüksek Lisans

    Türkçe

    Türkçe

    2018

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ İBRAHİM ALPER DOĞRU

    DR. MURAT DÖRTERLER

  3. How cryptographic implementations affect mobile agent systems

    Şifreleme gerçekleştirmelerinin gezgin aracı internet sistemlerini nasıl etkilediği

    İSMAİL ULUKUŞ

    Yüksek Lisans

    İngilizce

    İngilizce

    2003

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi Üniversitesi

    Sistem ve Kontrol Mühendisliği Ana Bilim Dalı

    PROF. DR. EMİN ANARIM

  4. Sınıflandırma ve regresyon ağaçları ile rastgele orman algoritması kullanarak botnet tespiti: van yüzüncü yıl üniversitesi örneği

    Botnet detection by using classification and regression trees with random forest algorithms: example of van yuzuncu yil university

    DUYGU KORKMAZ

    Yüksek Lisans

    Türkçe

    Türkçe

    2018

    İstatistikVan Yüzüncü Yıl Üniversitesi

    İstatistik Ana Bilim Dalı

    PROF. DR. HALİT ERAY ÇELİK

  5. Spam detection by using word-vector learning algorithm in online social networks

    Çevrimiçi sosyal ağlarda kelime-vektör öğrenme algoritması kullanarak spam belirleme

    ASO KHALEEL AMEEN SALIHI

    Yüksek Lisans

    İngilizce

    İngilizce

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolFırat Üniversitesi

    Yazılım Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ BUKET KAYA