Geri Dön

Graph representation learning for text-based event detection

Metin tabanlı olay tespiti için çizge temsil öğrenimi

  1. Tez No: 704819
  2. Yazar: HİLAL GENÇ
  3. Danışmanlar: DR. ÖĞR. ÜYESİ BURCU YILMAZ
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Olayların Tespiti, Çizge Teorisi, Sosyal Ağ Analizi, Yapay Sinir Ağları, Event Detection, Graph Representation Learning, Social Networking Analysis, Neural Networks
  7. Yıl: 2021
  8. Dil: İngilizce
  9. Üniversite: Gebze Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 106

Özet

Olay, normal davranışlardan farklı davranışların olduğu durumlardır. Her geçen gün bir çok olay gerçekleşmektedir. Her geçen gün sosyal medyadaki paylaşımların sayısı düşünüldüğünde bu bilgi kirliliğinden olayların sosyal medyadaki etkilerinin tespit edilmesi gerekmektedir. Olay tespit yöntemleri de sosyal ağları analiz ederek olay tetikleyicileri, olayın zamanı, olayda bahsi geçen kişiler, konum gibi olaya ait bilgileri tespit etmeyi amaçlamaktadır. Tez çalışmasında olayın en önemli yapı taşlarından biri olan zaman kavramına yoğunlaşılmıştır. Bu amaçla mikroblog yazılarından olaylara ait zaman vektör temsillerinin çıkarılması üzerine çizge tabanlı modeller geliştirilmiştir. Microblog yazıları, kullanıcı ve zaman bilgileri yılan çizgesi adını verdiğimiz çizge gösterimine dönüştürülmüştür. Yılan çizgesi microblog yazılarını yazan kişi, ne zaman yazıldığı gibi bilgilerin yanında metinde geçen kelimeleri içeren zengin bir gösterim sunmaktadır. Bu gösterim kavramlar ve aralarındaki ilişkileri de barındırmaktadır. Node2vec algoritması düğümlerin vektör temsilerini ve graph2vec algoritması da alt çizgelerin vektör temsilerini çıkartmaktadır. Zaman bilgisine ait daha fazla bilgiyi çizgelere gömmek için gün, ay, yıl gibi zaman hiyerarşi bilgisi ile çizgeler zenginleştirilmiştir. Çizgelerdeki zaman harici gibi diğer kavramların da daha iyi öğrenilmesi için transfer öğrenme modelleri kullanılmıştır. Elde edilen zaman ve diğer kavramlar için vektör temsillerinin başarısına dair çeşitli deneyler gerçekleştirilmiştir. Zaman vektör gösterimlerini değerlendirmek için oluşturduğumu gösterimde aynı ayda olan günlerin vektör gösterimlerinin özellik vektör uzayında gruplaştığı gözlemlenmiştir. Mikrobloglar için çıkarılan vektör temsillerinin başarısını test etmek için yapılan deneylerde ise bu temsiller ile eğitilmiş Uzun Kısa Vadeli Hafıza Ağları (LSTM) derin öğrenme modeli ile anahtar kelimeler test edilmeye çalışılmıştır.

Özet (Çeviri)

An event is a situation where there is behavior that differs from normal behavior. Many events emerge each day. Considering the volume of content that users share on social media daily, identifying events is necessary. The field of event detection encompasses event triggers (which we extract from social media), time, people, location, etc. In our study, we observe that time is one of the most crucial aspects of an event. Thus, we decided to use graph representation learning algorithms to extract vector representations (or embeddings) from microblog posts. These embeddings can represent an entire microblog post or key information within the dataset. We organize all key information (dates, words, and users) in the form of a graph, known as SnakeGraph. The SnakeGraph captures information such as a given microblog post's user, date, and words. We retrieve node embeddings using the node2vec algorithm and subgraph embeddings using the graph2vec algorithm. We enrich the graph by incorporating hierarchical date information, which consists of the year, the month, and then the day. We also use an approach inspired by transfer learning to enhance the vector representations. We extract the embeddings of dates and other key information, and we conduct a variety of experiments. To evaluate the date embeddings, we created a visualization which shows that two similar dates are closer to each other in the embedding space. To test how effective are the embeddings of the microblog posts we extracted, we use the long short-term memory (LSTM) neural network.

Benzer Tezler

  1. Kelime gömme vektörlerinin graf dönüşümü yoluyla metin sınıflandırmada kullanımı

    Use of word embedding vectors in text classification through graph conversion

    ELİF DORUKBAŞI

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKarabük Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. İLKER TÜRKER

  2. Çizge tabanlı metin özetleme

    Graph based text summarization

    CAN YALKIN

    Yüksek Lisans

    Türkçe

    Türkçe

    2014

    Mühendislik BilimleriYıldız Teknik Üniversitesi

    Matematik Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. NİLGÜN GÜLER BAYAZIT

  3. Prediction of pathogen-host interactions with protein sequence embeddings using deep learning

    Patojen-konak etkileşimlerinin derin öğrenme yöntemleri kullanılarak tahmin edilmesi

    BÜŞRA OĞUZOĞLU

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ARZUCAN ÖZGÜR TÜRKMEN

  4. Machine learning methods in natural language processing

    Doğal dil işlemede makine öğrenmesi yöntemleri

    BETÜL GÜVENÇ

    Yüksek Lisans

    İngilizce

    İngilizce

    2016

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi Üniversitesi

    Hesaplamalı Bilimler ve Mühendislik Ana Bilim Dalı

    YRD. DOÇ. DR. FATİH ECEVİT

  5. Neural semanti̇c parsing, annotation and evaluation for Turkish

    Türkçe için nöral semantik ayrıştırma, etiketleme ve değerlendirme

    NECVA BÖLÜCÜ

    Doktora

    İngilizce

    İngilizce

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHacettepe Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. HARUN ARTUNER

    DOÇ. DR. BURCU CAN BUĞLALILAR