A knowledge-graph based graph neural network model to identify topics in short texts
Kısa yazılar içerisindeki konuları tanımlamak için bilgi grafiği tabanlı çizge sinir ağı modeli
- Tez No: 765009
- Danışmanlar: DR. ÖĞR. ÜYESİ SUSAN MICHELE ÜSKÜDARLI
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2022
- Dil: İngilizce
- Üniversite: Boğaziçi Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
- Sayfa Sayısı: 104
Özet
Konu modelleri, bir belge koleksiyonunu analiz etmek için kullanılan olasılıksal üretken modellerdir. İnsanlar, belgelerden gizli yapıları çıkarmak için uzun yıllardır konu modellerinden yararlandı. Ancak, Gizli Dirichlet Tahsisi (LDA) gibi klasik konu modelleri, kullanıcı tarafından oluşturulan sosyal medya içeriğinde tipik olan kısa metinlerle ilgili sorunlar yaşar. Kısa metinlerin sınırlı bağlamı nedeniyle, onları iyi temsil etmeyen kelime temsilleri çantasıyla geniş kelime dağarcığından yorumlanabilir konular öğrenemezler. Bu tez, belgelerin, bilgi grafiği olarak Wikidata kullanılarak, varlığa özel ilişkilere sahip çizgeler olarak temsil edildiği, Çizge Sinir Ağlarına (GNN) dayalı bir konu modeli önermektedir. Bir çizge dikkat ağı, bu belgelerin yerleştirmelerini ve kendi çıktılarını, olasılıksal üretken konu modeli olan Varlık Gömülü Konu Modellemesi'ne (EETM), konuları elde edebilmesi için, olasılıksal dağılım parametreleri şeklinde geçirerek öğrenir. Modelimizi Twitter'dan siyaset, spor, pandemi ve trend olan haberlerle ilgili çeşitli kısa metin koleksiyonları ile değerlendirdik. Modelimizden sağladığı konuların öğrenilen yerleştirmeleri ve nitelikleri ile ilgili gözlemlerimizle ilgili ayrıntılı bir tartışma sunduk.
Özet (Çeviri)
Topic models are probabilistic generative models used to analyze a collection of documents. People have leveraged topic models for many years to extract hidden structures from documents. However, classical topic models such as Latent Dirichlet Allocation (LDA) have issues with short texts typical in user-generated social media content. Due to the limited context of short texts, they fail to learn interpretable topics from extensive vocabularies with the bag of word representations that do not represent them well. This thesis proposes a topic model based on Graph Neural Networks (GNN) where documents are represented as graphs with entity-specific relations using Wikidata as a knowledge graph. A graph attention network learns the embeddings of these documents whose outputs are passed to the probabilistic generative topic model Entity Embedded Topic Modeling (EETM) as probability distribution parameters to yield the topics. We evaluate our model with various short text collections fetched from Twitter related to politics, sports, pandemics, and trending news events. We provide a detailed discussion regarding our observations related to the learned embeddings and qualities of topics resulting from our model.
Benzer Tezler
- Relation prediction over biomedical knowledge bases for drugrepositioning
Başlık çevirisi yok
MEHMET GÖKHAN BAKAL
- Heterojen biyomedikal verinin bilgi çizgeleri ve derin öğrenme tabanlı analizi ile protein fonksiyonlarının otomatik tahmini
Automated prediction of protein functions with knowledge graph representations and deep learning-based analysis of heterogeneous biomedical data
ERVA ULUSOY
Yüksek Lisans
Türkçe
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHacettepe ÜniversitesiBiyoinformatik Ana Bilim Dalı (Disiplinlerarası)
DOÇ. DR. TUNCA DOĞAN
- Derin öğrenme yöntemi ile optik uydu görüntülerinden gemi tespiti
Ship detection by optical satellite images with deep learning method
OSMAN DUMAN
Yüksek Lisans
Türkçe
2019
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesiİletişim Sistemleri Ana Bilim Dalı
PROF. DR. MESUT KARTAL
- Object and relation-centric reasoning of action effects in push manipulation tasks
İtme manipulasyonlu görevlerde aksiyon-efekt kuramının nesnel ve ilişkisel eksende muhakemesi
AHMET ERCAN TEKDEN
Yüksek Lisans
İngilizce
2020
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ EMRE UĞUR
- Enhancing cross-market recommendation system using graph isomorphism networks
Çizge izomorfizm ağları kullanarak çapraz pazar tavsiye sistemi geliştirme
SÜMEYYE ÖZTÜRK
Yüksek Lisans
İngilizce
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. ŞULE ÖĞÜDÜCÜ
DR. RESUL TUGAY