Information extraction from news related texts using graph mining techniques
Çizge madenciliği tekniklerini kullanarak haber ile ilgili metinlerden bilgi çıkarımı
- Tez No: 638035
- Danışmanlar: PROF. DR. PINAR KARAGÖZ
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2020
- Dil: İngilizce
- Üniversite: Orta Doğu Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 99
Özet
Veri kullanılabilirliğindeki artış ve doğal dil işlemedeki ilerleme, bilgi çıkarma için yeni tekniklerin geliştirilmesine temel oluşturmaktadır. Metin madenciliği konseptlerini kullanarak metinsel içeriklerden olay tespiti, literatürde iyi araştırılmış bir alandır. Bununla birlikte, son yıllarda çizge vektörleri teknikleri, çizgelerde metinsel içerikleri temsil etme fırsatı sunar, çünkü metinler çizge yapısında ek niteliklerle zenginleştirilebilir ve çizgelerle karmaşık ilişkiler daha iyi modellenebilir. Bu tez çalışmasında, metinleri çizge yapısında temsil ederek örüntü çıkarımı üzerinde çalışılmış olunup haber tahminlemesi için yöntem geliştirilmiştir. İlk adım olarak çizge gösterim teknikleri incelenmiştir. Daha sonra sık alt çizge madenciliği ve ardışık zamanlı kural madenciliği algoritmaları uygulanmıştır. Bunun nedeni, alt çizgelerin haberlerin içeriğinin ana hatlarını içermesi ve sıralı kuralların alt çizgelerin zamansal ilişkilerini göstermesidir. Son olarak, sıralı örüntüler benzerlik puanlarına göre öneri için kullanılmıştır. Benzerliği ölçmek için çeşitli çizge vektörleri teknikleri incelenmiştir.
Özet (Çeviri)
The increase in data availability and the progress in natural language processing provide a basis for the development of new techniques for information extraction. Event detection from textual content using the text mining concepts is a well-researched field in the literature. However, graph embedding techniques in recent years provide an opportunity to represent textual contents in graphs because texts can be enriched with additional attributes in graphs, and the complex relationships within graphs can be modeled better. In this thesis work, graph-based representations of textual resources such as news are examined for pattern extraction, and a method is proposed for news prediction. As the first step, graph representation techniques are investigated. Afterward, frequent subgraph mining and sequential rule mining algorithms are applied. We consider that subgraphs contain the main story of the contents, and sequential rules indicate the subgraph patterns' temporal relationships. Finally, the sequential patterns are used for recommendation according to their similarity scores. In order to measure the similarity, various graph embedding techniques are also examined.
Benzer Tezler
- Akademik hukuk makalelerinde atıf önerisi
Citation recommendation on scholarly legal articles
DOĞUKAN ARSLAN
Yüksek Lisans
Türkçe
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. GÜLŞEN ERYİĞİT
- Borsa istanbul (BIST) hisse fiyat değişim yönünün ilişkisel borsa ağı kullanılarak tahmin edilmesi
Forecasting stock price change direction using relational stock market network on borsa Istanbul (BIST)
BİRCAN ERGÜR
Yüksek Lisans
Türkçe
2014
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. ZEHRA ÇATALTEPE
- Financial named entity recognition for turkish news texts
Türkçe haber metinlerinde finansal varlık ismi tanıma
DUYGU DİNÇ
Yüksek Lisans
İngilizce
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. ALİ HİKMET DOĞRU
PROF. DR. PINAR KARAGÖZ
- Türkçe için sahte haber tespit modelinin oluşturulması
A fake news detection model for Turkish language
UĞUR MERTOĞLU
Doktora
Türkçe
2020
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHacettepe ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ BURKAY GENÇ
PROF. DR. HAYRİ SEVER
- Dinamik sosyal ağlarda akan ve çok boyutlu veri üzerinden analiz ve tahmin yapılması
Analysis and prediction in sparse and high dimensional data with using dynamic social networks
ONUR CAN SERT
Doktora
Türkçe
2020
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolTOBB Ekonomi ve Teknoloji ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. TANSEL ÖZYER