Geri Dön

Embedding-based clustering for target specific stances

Başlık çevirisi mevcut değil.

  1. Tez No: 648536
  2. Yazar: AMMAR RAŞİD
  3. Danışmanlar: PROF. DR. ARİF TANJU ERDEM, DR. ÖĞR. ÜYESİ REYYAN YENİTERZİ
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2020
  8. Dil: İngilizce
  9. Üniversite: Özyeğin Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Bilimleri Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 88

Özet

Çeşitli konularda bir topluluktaki hassas taneli sapmaları yakalamak için denetimsiz bir kullanıcı duruş algılama yöntemi öneriyoruz. Kullanıcıları belirli bir konudaki tweet'lerinin içeriğine göre temsil etmek için önceden eğitilmiş evrensel cümle kodlayıcıları kullanıyoruz. Kullanıcı vektörleri UMAP kullanılarak daha düşük boyutlu bir alana yansıtılır, daha sonra HDBSCAN kullanılarak kümelenir. Yöntemimiz, farklı alanlardaki iki veri kümesinde önceki yaklaşımlardan daha iyi performans göstererek 0,89 ile 0,97 arasında değişen hassasiyet ve hatırlama puanları elde eder. UEFA Süper Kupa'nın 2019 finali hakkında 300k'dan fazla tweet'in bir veri kümesini derledik ve 12k kullanıcıyı Liverpool FC veya Chelsea FC hayranları olarak etiketledik. Twitter kullanıcılarının tutumlarını analiz etmek için yöntemimizi kullandık ve çeşitli kutuplaşma sorunlarına karşı kullanıcı tutumları arasında bir korelasyon olduğunu fark ettik. Elde edilen kümeleri, çeşitli konularda polarizasyonu ölçmek ve kümeler arasındaki anlamsal sapmayı analiz etmek için kullandık.

Özet (Çeviri)

We propose an unsupervised user stance detection method to capture fine grained divergences in a community across various topics. We employ pre-trained universal sentence encoders to represent users based on the content of their tweets on a particular topic. User vectors are projected onto a lower dimensional space using UMAP, then clustered using HDBSCAN. Our method performs better than previous approaches on two datasets in different domains, achieving precision and recall scores ranging between 0.89 and 0.97. We compiled a dataset of more than 300k tweets about UEFA Super Cup's 2019 final, and tagged 12k users as Liverpool FC or Chelsea FC fans. We utilized our method to analyze the stances of Twitter users noting a correlation between user stances towards various polarizing issues. We used the resultant clusters to quantify the polarization in various topics, and analyze the semantic divergence between clusters.

Benzer Tezler

  1. Hakem atama otomasyonu için bir karar destek sistemi: Doğal dil işleme ve veri-güdümlü optimizasyon ile bütünleşik bir yaklaşım

    A decision support system for reviewer assignment automation: An integrated approach with natural language processing and data-driven optimization

    MELTEM AKSOY

    Doktora

    Türkçe

    Türkçe

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    DOÇ. DR. SEDA YANIK ÖZBAY

    PROF. DR. MEHMET FATİH AMASYALI

  2. Çapraz e-ticaret pazarlarında hibrit öneri sistemi

    Hybrid recommendation system at cross e-commerce markets

    EMRE KÖSE

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. YUSUF YASLAN

  3. Analysis of context embeddings in word sense induction

    Bağlam gömülerinin sözcük anlamı tümevarımda incelenmesi

    OSMAN BAŞKAYA

    Yüksek Lisans

    İngilizce

    İngilizce

    2015

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKoç Üniversitesi

    Bilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı

    DOÇ. DR. DENİZ YURET

  4. Efficient optimization algorithms for computational biology

    Hesaplamalı biyolojide etkin eniyileme algoritmaları

    OĞUZ CAN BİNATLI

    Doktora

    İngilizce

    İngilizce

    2024

    Endüstri ve Endüstri MühendisliğiKoç Üniversitesi

    Endüstri Mühendisliği ve Operasyon Yönetimi

    PROF. DR. MEHMET GÖNEN

  5. Soru dokümanlarının anlamsal benzerliklerine dayalı derin öğrenme tabanlı kümeleme analizi

    Deep learning based clustering analysis based on the semantic similarity of question documents

    ERAY YELMEN

    Yüksek Lisans

    Türkçe

    Türkçe

    2020

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKocaeli Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. NEVCİHAN DURU