Graph representation learning for text-based event detection
Metin tabanlı olay tespiti için çizge temsil öğrenimi
- Tez No: 704819
- Danışmanlar: DR. ÖĞR. ÜYESİ BURCU YILMAZ
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Olayların Tespiti, Çizge Teorisi, Sosyal Ağ Analizi, Yapay Sinir Ağları, Event Detection, Graph Representation Learning, Social Networking Analysis, Neural Networks
- Yıl: 2021
- Dil: İngilizce
- Üniversite: Gebze Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 106
Özet
Olay, normal davranışlardan farklı davranışların olduğu durumlardır. Her geçen gün bir çok olay gerçekleşmektedir. Her geçen gün sosyal medyadaki paylaşımların sayısı düşünüldüğünde bu bilgi kirliliğinden olayların sosyal medyadaki etkilerinin tespit edilmesi gerekmektedir. Olay tespit yöntemleri de sosyal ağları analiz ederek olay tetikleyicileri, olayın zamanı, olayda bahsi geçen kişiler, konum gibi olaya ait bilgileri tespit etmeyi amaçlamaktadır. Tez çalışmasında olayın en önemli yapı taşlarından biri olan zaman kavramına yoğunlaşılmıştır. Bu amaçla mikroblog yazılarından olaylara ait zaman vektör temsillerinin çıkarılması üzerine çizge tabanlı modeller geliştirilmiştir. Microblog yazıları, kullanıcı ve zaman bilgileri yılan çizgesi adını verdiğimiz çizge gösterimine dönüştürülmüştür. Yılan çizgesi microblog yazılarını yazan kişi, ne zaman yazıldığı gibi bilgilerin yanında metinde geçen kelimeleri içeren zengin bir gösterim sunmaktadır. Bu gösterim kavramlar ve aralarındaki ilişkileri de barındırmaktadır. Node2vec algoritması düğümlerin vektör temsilerini ve graph2vec algoritması da alt çizgelerin vektör temsilerini çıkartmaktadır. Zaman bilgisine ait daha fazla bilgiyi çizgelere gömmek için gün, ay, yıl gibi zaman hiyerarşi bilgisi ile çizgeler zenginleştirilmiştir. Çizgelerdeki zaman harici gibi diğer kavramların da daha iyi öğrenilmesi için transfer öğrenme modelleri kullanılmıştır. Elde edilen zaman ve diğer kavramlar için vektör temsillerinin başarısına dair çeşitli deneyler gerçekleştirilmiştir. Zaman vektör gösterimlerini değerlendirmek için oluşturduğumu gösterimde aynı ayda olan günlerin vektör gösterimlerinin özellik vektör uzayında gruplaştığı gözlemlenmiştir. Mikrobloglar için çıkarılan vektör temsillerinin başarısını test etmek için yapılan deneylerde ise bu temsiller ile eğitilmiş Uzun Kısa Vadeli Hafıza Ağları (LSTM) derin öğrenme modeli ile anahtar kelimeler test edilmeye çalışılmıştır.
Özet (Çeviri)
An event is a situation where there is behavior that differs from normal behavior. Many events emerge each day. Considering the volume of content that users share on social media daily, identifying events is necessary. The field of event detection encompasses event triggers (which we extract from social media), time, people, location, etc. In our study, we observe that time is one of the most crucial aspects of an event. Thus, we decided to use graph representation learning algorithms to extract vector representations (or embeddings) from microblog posts. These embeddings can represent an entire microblog post or key information within the dataset. We organize all key information (dates, words, and users) in the form of a graph, known as SnakeGraph. The SnakeGraph captures information such as a given microblog post's user, date, and words. We retrieve node embeddings using the node2vec algorithm and subgraph embeddings using the graph2vec algorithm. We enrich the graph by incorporating hierarchical date information, which consists of the year, the month, and then the day. We also use an approach inspired by transfer learning to enhance the vector representations. We extract the embeddings of dates and other key information, and we conduct a variety of experiments. To evaluate the date embeddings, we created a visualization which shows that two similar dates are closer to each other in the embedding space. To test how effective are the embeddings of the microblog posts we extracted, we use the long short-term memory (LSTM) neural network.
Benzer Tezler
- Kelime gömme vektörlerinin graf dönüşümü yoluyla metin sınıflandırmada kullanımı
Use of word embedding vectors in text classification through graph conversion
ELİF DORUKBAŞI
Yüksek Lisans
Türkçe
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKarabük ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. İLKER TÜRKER
- Çizge tabanlı metin özetleme
Graph based text summarization
CAN YALKIN
Yüksek Lisans
Türkçe
2014
Mühendislik BilimleriYıldız Teknik ÜniversitesiMatematik Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. NİLGÜN GÜLER BAYAZIT
- Prediction of pathogen-host interactions with protein sequence embeddings using deep learning
Patojen-konak etkileşimlerinin derin öğrenme yöntemleri kullanılarak tahmin edilmesi
BÜŞRA OĞUZOĞLU
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. ARZUCAN ÖZGÜR TÜRKMEN
- Machine learning methods in natural language processing
Doğal dil işlemede makine öğrenmesi yöntemleri
BETÜL GÜVENÇ
Yüksek Lisans
İngilizce
2016
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi ÜniversitesiHesaplamalı Bilimler ve Mühendislik Ana Bilim Dalı
YRD. DOÇ. DR. FATİH ECEVİT
- Neural semanti̇c parsing, annotation and evaluation for Turkish
Türkçe için nöral semantik ayrıştırma, etiketleme ve değerlendirme
NECVA BÖLÜCÜ
Doktora
İngilizce
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHacettepe ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. HARUN ARTUNER
DOÇ. DR. BURCU CAN BUĞLALILAR