Embedding-based clustering for target specific stances
Başlık çevirisi mevcut değil.
- Tez No: 648536
- Danışmanlar: PROF. DR. ARİF TANJU ERDEM, DR. ÖĞR. ÜYESİ REYYAN YENİTERZİ
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2020
- Dil: İngilizce
- Üniversite: Özyeğin Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Bilimleri Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 88
Özet
Çeşitli konularda bir topluluktaki hassas taneli sapmaları yakalamak için denetimsiz bir kullanıcı duruş algılama yöntemi öneriyoruz. Kullanıcıları belirli bir konudaki tweet'lerinin içeriğine göre temsil etmek için önceden eğitilmiş evrensel cümle kodlayıcıları kullanıyoruz. Kullanıcı vektörleri UMAP kullanılarak daha düşük boyutlu bir alana yansıtılır, daha sonra HDBSCAN kullanılarak kümelenir. Yöntemimiz, farklı alanlardaki iki veri kümesinde önceki yaklaşımlardan daha iyi performans göstererek 0,89 ile 0,97 arasında değişen hassasiyet ve hatırlama puanları elde eder. UEFA Süper Kupa'nın 2019 finali hakkında 300k'dan fazla tweet'in bir veri kümesini derledik ve 12k kullanıcıyı Liverpool FC veya Chelsea FC hayranları olarak etiketledik. Twitter kullanıcılarının tutumlarını analiz etmek için yöntemimizi kullandık ve çeşitli kutuplaşma sorunlarına karşı kullanıcı tutumları arasında bir korelasyon olduğunu fark ettik. Elde edilen kümeleri, çeşitli konularda polarizasyonu ölçmek ve kümeler arasındaki anlamsal sapmayı analiz etmek için kullandık.
Özet (Çeviri)
We propose an unsupervised user stance detection method to capture fine grained divergences in a community across various topics. We employ pre-trained universal sentence encoders to represent users based on the content of their tweets on a particular topic. User vectors are projected onto a lower dimensional space using UMAP, then clustered using HDBSCAN. Our method performs better than previous approaches on two datasets in different domains, achieving precision and recall scores ranging between 0.89 and 0.97. We compiled a dataset of more than 300k tweets about UEFA Super Cup's 2019 final, and tagged 12k users as Liverpool FC or Chelsea FC fans. We utilized our method to analyze the stances of Twitter users noting a correlation between user stances towards various polarizing issues. We used the resultant clusters to quantify the polarization in various topics, and analyze the semantic divergence between clusters.
Benzer Tezler
- Hakem atama otomasyonu için bir karar destek sistemi: Doğal dil işleme ve veri-güdümlü optimizasyon ile bütünleşik bir yaklaşım
A decision support system for reviewer assignment automation: An integrated approach with natural language processing and data-driven optimization
MELTEM AKSOY
Doktora
Türkçe
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
DOÇ. DR. SEDA YANIK ÖZBAY
PROF. DR. MEHMET FATİH AMASYALI
- Çapraz e-ticaret pazarlarında hibrit öneri sistemi
Hybrid recommendation system at cross e-commerce markets
EMRE KÖSE
Yüksek Lisans
Türkçe
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. YUSUF YASLAN
- Analysis of context embeddings in word sense induction
Bağlam gömülerinin sözcük anlamı tümevarımda incelenmesi
OSMAN BAŞKAYA
Yüksek Lisans
İngilizce
2015
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKoç ÜniversitesiBilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı
DOÇ. DR. DENİZ YURET
- Efficient optimization algorithms for computational biology
Hesaplamalı biyolojide etkin eniyileme algoritmaları
OĞUZ CAN BİNATLI
Doktora
İngilizce
2024
Endüstri ve Endüstri MühendisliğiKoç ÜniversitesiEndüstri Mühendisliği ve Operasyon Yönetimi
PROF. DR. MEHMET GÖNEN
- Soru dokümanlarının anlamsal benzerliklerine dayalı derin öğrenme tabanlı kümeleme analizi
Deep learning based clustering analysis based on the semantic similarity of question documents
ERAY YELMEN
Yüksek Lisans
Türkçe
2020
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKocaeli ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. NEVCİHAN DURU