Spam detection by using network and text embedding approaches

Sosyal ağ analizi ve metin madenciliği kullanarak yanıltıcı yorumları tespit etme

PDF İndir

Tez No: 599755
Yazar: CENNET MERVE YILMAZ
Danışmanlar: DOÇ. DR. CEM İYİGÜN, DR. ÖĞR. ÜYESİ AHMET ONUR DURAHİM
Tez Türü: Yüksek Lisans
Konular: Endüstri ve Endüstri Mühendisliği, Industrial and Industrial Engineering
Anahtar Kelimeler: Belirtilmemiş.
Yıl: 2019
Dil: İngilizce
Üniversite: Orta Doğu Teknik Üniversitesi
Enstitü: Fen Bilimleri Enstitüsü
Ana Bilim Dalı: Endüstri Mühendisliği Ana Bilim Dalı
Bilim Dalı: Belirtilmemiş.
Sayfa Sayısı: 105

Özet

Siber ortama yayılmış bilgilerin doğruluğu ve tutarlı olmasının önemi her gecen gün daha da önemli hale gelmektedir. Potansiyel müşterilerin satın alma işlemleri öncesinde müşteri yorumlarını ve önerilerini internet üzerinden görüntüleyebilir olması, bilgi tutarlığının önemini özellikle e-ticaret (sanal ticaret) alanında daha da arttırmaktadır. Günümüzde bilginin bu kadar kolay erişilebilir olmasının yanında, ulaşılan bilginin doğruluğuyla ilgili kontrollerin yetersiz oluşu, bu bilginin güvenilir olup olmadığıyla ilgili kaygılar oluşturmaktadır. Ayrıca, hileli kullanıcılar spam(istenmeyen) bilgiler paylaşarak insanları yanlış yönlendirmektedir. Bu sebeplerle, güvenlik araştırmacıları tarafından hatalı ya da yanlış kullanıcı yorumlarının denetlenmesi kritik bir problem haline dönüşmüştür. Bu çalışmada, DocRep, NodeRep ve SPR2EP yaklaşımlarıyla spam kullanıcı yorumlarını analiz ettik ve bu yaklaşımların farklarını inceledik. Çalışmamız için kullanıcı yorum metinlerinden ve sosyal ağ bağlantı bilgilerinden yararlandık. Kullandığımız yöntemler, yorum metinlerinden elde edilen bilgi ve kullanıcı – ürün ağ yapısı bilgisini birleştirmektedir. Kullanıcıların, yazdıkları yorumlar ve yorumladıkları ürün arasında makine öğrenmesi algoritmaları kullanılarak, her yorum, kullanıcı ve ürün için, bu birleşenlerin özelliklerini yansıtan vektörler oluşturuldu ve oluşturulan bu vektörler kullanıcı yorumlarının spam olup olmadığını belirlemek için sınıflandırıcı algoritmaların girdisi olarak kullanıldı. Yapılan karşılaştırmalı çalışma neticesinde, sadece sosyal ağlardan yararlanan yaklaşım kullanıcı yorumu verişinde diğer yaklaşımlara göre daha yüksek performans elde edilmiştir

Özet (Çeviri)

Authenticity and reliability of the information spread over the cyberspace is becoming increasingly important, especially in e-commerce. This is because potential customers check reviews and customer feedbacks online before making a purchasing decision. Although this information is easily accessible through related websites, lack of verification of the authenticity of these reviews raises concerns about their reliability. Besides, fraudulent users disseminate disinformation to deceive people into acting against their interest. So, detection of fake and unreliable reviews is a crucial problem that must be addressed. In this study, we analyze and compare three different spam review detection approaches, DocRep, NodeRep and SPR2EP, that utilize review text only, network information only and the one that is proposed in this study that incorporates knowledge extracted from the textual content of the reviews with information obtained by exploiting the underlying reviewer-product network structure, respectively. One of the important contributions of this study is the proposed framework, SPR2EP, is that it benefits from both review text and network information. In SPR2EP approach, first, feature vectors are learned for each review, reviewer and product by utilizing state-of-the-art algorithms developed for learning document and node embeddings, and then these are fed into a classifier to identify opinion spam. It minimizes the feature engineering effort. The effectiveness of our framework approaches that utilize network embeddings over existing techniques on detecting spam reviews is demonstrated in three different data sets containing online reviews.

Benzer Tezler

Tez No
755156
Doğal dil işleme tekniklerini ve derin öğrenme algoritmalarını kullanarak sosyal ağlarda spam tespiti
Using natural language processing techniques and deep learning algorithms for detecting spam on social networks
REZAN BAKIR
Doktora
Türkçe
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol Kırıkkale Üniversitesi
Bilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. HASAN ERBAY
Tez No
514977
Sosyal ağlara yönelik öğrenmeye dayalı bir spam hesap tespit modeli ve uygulaması
A spam account detection model based on learning and its application for social networks
OĞUZHAN ÇITLAK
Yüksek Lisans
Türkçe
2018
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol Gazi Üniversitesi
Bilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ İBRAHİM ALPER DOĞRU
DR. MURAT DÖRTERLER
Tez No
139400
How cryptographic implementations affect mobile agent systems
Şifreleme gerçekleştirmelerinin gezgin aracı internet sistemlerini nasıl etkilediği
İSMAİL ULUKUŞ
Yüksek Lisans
İngilizce
2003
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol Boğaziçi Üniversitesi
Sistem ve Kontrol Mühendisliği Ana Bilim Dalı
PROF. DR. EMİN ANARIM
Tez No
504024
Sınıflandırma ve regresyon ağaçları ile rastgele orman algoritması kullanarak botnet tespiti: Van Yüzüncü Yıl Üniversitesi örneği
Botnet detection by using classification and regression trees with random forest algorithms: Example of Van Yuzuncu Yil University
DUYGU KORKMAZ
Yüksek Lisans
Türkçe
2018
İstatistik Van Yüzüncü Yıl Üniversitesi
İstatistik Ana Bilim Dalı
PROF. DR. HALİT ERAY ÇELİK
Tez No
539573
Spam detection by using word-vector learning algorithm in online social networks
Çevrimiçi sosyal ağlarda kelime-vektör öğrenme algoritması kullanarak spam belirleme
ASO KHALEEL AMEEN SALIHI
Yüksek Lisans
İngilizce
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol Fırat Üniversitesi
Yazılım Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ BUKET KAYA

Geri Dön