Spam detection by using network and text embedding approaches
Sosyal ağ analizi ve metin madenciliği kullanarak yanıltıcı yorumları tespit etme
- Tez No: 599755
- Danışmanlar: DOÇ. DR. CEM İYİGÜN, DR. ÖĞR. ÜYESİ AHMET ONUR DURAHİM
- Tez Türü: Yüksek Lisans
- Konular: Endüstri ve Endüstri Mühendisliği, Industrial and Industrial Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2019
- Dil: İngilizce
- Üniversite: Orta Doğu Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Endüstri Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 105
Özet
Siber ortama yayılmış bilgilerin doğruluğu ve tutarlı olmasının önemi her gecen gün daha da önemli hale gelmektedir. Potansiyel müşterilerin satın alma işlemleri öncesinde müşteri yorumlarını ve önerilerini internet üzerinden görüntüleyebilir olması, bilgi tutarlığının önemini özellikle e-ticaret (sanal ticaret) alanında daha da arttırmaktadır. Günümüzde bilginin bu kadar kolay erişilebilir olmasının yanında, ulaşılan bilginin doğruluğuyla ilgili kontrollerin yetersiz oluşu, bu bilginin güvenilir olup olmadığıyla ilgili kaygılar oluşturmaktadır. Ayrıca, hileli kullanıcılar spam(istenmeyen) bilgiler paylaşarak insanları yanlış yönlendirmektedir. Bu sebeplerle, güvenlik araştırmacıları tarafından hatalı ya da yanlış kullanıcı yorumlarının denetlenmesi kritik bir problem haline dönüşmüştür. Bu çalışmada, DocRep, NodeRep ve SPR2EP yaklaşımlarıyla spam kullanıcı yorumlarını analiz ettik ve bu yaklaşımların farklarını inceledik. Çalışmamız için kullanıcı yorum metinlerinden ve sosyal ağ bağlantı bilgilerinden yararlandık. Kullandığımız yöntemler, yorum metinlerinden elde edilen bilgi ve kullanıcı – ürün ağ yapısı bilgisini birleştirmektedir. Kullanıcıların, yazdıkları yorumlar ve yorumladıkları ürün arasında makine öğrenmesi algoritmaları kullanılarak, her yorum, kullanıcı ve ürün için, bu birleşenlerin özelliklerini yansıtan vektörler oluşturuldu ve oluşturulan bu vektörler kullanıcı yorumlarının spam olup olmadığını belirlemek için sınıflandırıcı algoritmaların girdisi olarak kullanıldı. Yapılan karşılaştırmalı çalışma neticesinde, sadece sosyal ağlardan yararlanan yaklaşım kullanıcı yorumu verişinde diğer yaklaşımlara göre daha yüksek performans elde edilmiştir
Özet (Çeviri)
Authenticity and reliability of the information spread over the cyberspace is becoming increasingly important, especially in e-commerce. This is because potential customers check reviews and customer feedbacks online before making a purchasing decision. Although this information is easily accessible through related websites, lack of verification of the authenticity of these reviews raises concerns about their reliability. Besides, fraudulent users disseminate disinformation to deceive people into acting against their interest. So, detection of fake and unreliable reviews is a crucial problem that must be addressed. In this study, we analyze and compare three different spam review detection approaches, DocRep, NodeRep and SPR2EP, that utilize review text only, network information only and the one that is proposed in this study that incorporates knowledge extracted from the textual content of the reviews with information obtained by exploiting the underlying reviewer-product network structure, respectively. One of the important contributions of this study is the proposed framework, SPR2EP, is that it benefits from both review text and network information. In SPR2EP approach, first, feature vectors are learned for each review, reviewer and product by utilizing state-of-the-art algorithms developed for learning document and node embeddings, and then these are fed into a classifier to identify opinion spam. It minimizes the feature engineering effort. The effectiveness of our framework approaches that utilize network embeddings over existing techniques on detecting spam reviews is demonstrated in three different data sets containing online reviews.
Benzer Tezler
- Doğal dil işleme tekniklerini ve derin öğrenme algoritmalarını kullanarak sosyal ağlarda spam tespiti
Using natural language processing techniques and deep learning algorithms for detecting spam on social networks
REZAN BAKIR
Doktora
Türkçe
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKırıkkale ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. HASAN ERBAY
- Sosyal ağlara yönelik öğrenmeye dayalı bir spam hesap tespit modeli ve uygulaması
A spam account detection model based on learning and its application for social networks
OĞUZHAN ÇITLAK
Yüksek Lisans
Türkçe
2018
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ İBRAHİM ALPER DOĞRU
DR. MURAT DÖRTERLER
- How cryptographic implementations affect mobile agent systems
Şifreleme gerçekleştirmelerinin gezgin aracı internet sistemlerini nasıl etkilediği
İSMAİL ULUKUŞ
Yüksek Lisans
İngilizce
2003
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi ÜniversitesiSistem ve Kontrol Mühendisliği Ana Bilim Dalı
PROF. DR. EMİN ANARIM
- Sınıflandırma ve regresyon ağaçları ile rastgele orman algoritması kullanarak botnet tespiti: van yüzüncü yıl üniversitesi örneği
Botnet detection by using classification and regression trees with random forest algorithms: example of van yuzuncu yil university
DUYGU KORKMAZ
Yüksek Lisans
Türkçe
2018
İstatistikVan Yüzüncü Yıl Üniversitesiİstatistik Ana Bilim Dalı
PROF. DR. HALİT ERAY ÇELİK
- Spam detection by using word-vector learning algorithm in online social networks
Çevrimiçi sosyal ağlarda kelime-vektör öğrenme algoritması kullanarak spam belirleme
ASO KHALEEL AMEEN SALIHI
Yüksek Lisans
İngilizce
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolFırat ÜniversitesiYazılım Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ BUKET KAYA