Haber arşivlerinde olay çizge modeli ile yapılandırılmış bilgi keşfi ve soru cevaplama
Structured information discovery and question answering with an event graph model in news archives
- Tez No: 920522
- Danışmanlar: DR. ÖĞR. ÜYESİ BURCU YILMAZ
- Tez Türü: Doktora
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2024
- Dil: Türkçe
- Üniversite: Gebze Teknik Üniversitesi
- Enstitü: Lisansüstü Eğitim Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 154
Özet
Hızla artan dijital bilgi kaynakları, özellikle büyük ölçekli haber arşivleri gibi zengin bağlamsal verilerde, doğru ve etkili bilgiye erişim süreçlerini daha karmaşık hale getirmiştir. Bu tez, çevrimiçi haber metinlerinden olay tabanlı bilgi çıkarımı ve bu bilgilerin çok adımlı soru cevaplama sistemlerinde kullanılması için bir çerçeve sunmaktadır. Çalışmada geliştirilen olay çizge modeli, yalnızca bireysel bilgi birimlerini çıkarmakla kalmamış, aynı zamanda olaylar arasındaki bağlamsal ve zamansal ilişkileri de yapılandırarak olay örgüsü zincirleri oluşturmayı amaçlamıştır. Model, isimlendirilmiş varlık merkezli alt çizge madenciliği ve zamansal bilgi entegrasyonu gibi yöntemlerle desteklenmiş; bu yaklaşımlar özellikle çok adımlı soruların yanıtlanmasında dikkate değer sonuçlar elde edilmesini sağlamıştır. Çalışmanın yeniliklerinden biri, Türkçe doğal dil işleme alanına uygun standart veri kümelerinin geliştirilmiş olmasıdır. Bu veri kümeleri, bilgi tabanlı soru cevaplama ve olay odaklı metin kümeleme gibi alanlarda kullanılmak üzere hazırlanmış ve literatürdeki büyük bir eksikliği gidermek üzere araştırmacılara sunulmuştur. Bunun yanı sıra, büyük dil modellerinin semantik ayrıştırma süreçleriyle zenginleştirilmesi ve komut istemi mühendisliği teknikleriyle performanslarının artırılması, çalışmayı yalnızca teorik bir katkı değil, aynı zamanda pratik bir dönüşüm aracı haline getirmiştir. Bu çalışma, dijital haber arşivlerinden bilgi çıkarımı ve çok adımlı soru cevaplama sistemleri için yapısal bir temel sunmakta ve bilgi erişim süreçlerini optimize etmek için yeni yöntemler önermektedir. Bununla birlikte, elde edilen bulgular, özellikle olay çizge modelinin daha geniş veri kümelerinde uygulanabilirliği ve dil modellerinin maliyet performans dengesi gibi konuların gelecekteki araştırmalar için potansiyel taşıdığını göstermektedir.
Özet (Çeviri)
Rapidly growing digital information sources, especially rich contextual data such as large-scale news archives, have made the processes of accessing accurate and effective information increasingly complex. This dissertation presents a framework for event-based information extraction from online news texts and the application of this information in multi-hop question answering systems. The event graph model developed in this study not only extracts individual information units but also structures contextual and temporal relationships between events to form coherent event chains. The model is supported by techniques such as named entity-centered subgraph mining and temporal information integration, which have demonstrated notable effectiveness, particularly in answering multi-hop questions. One of the key innovations of this study is the development of standardized datasets tailored to the Turkish natural language processing domain. These datasets are designed for use in areas such as knowledge-based question answering and event-centric text clustering, addressing a significant gap in the literature and providing valuable resources for researchers. Furthermore, the enrichment of large language models with semantic parsing processes and the enhancement of their performance through prompt engineering techniques have transformed this study into not only a theoretical contribution but also a practical tool for implementation. This research establishes a structural foundation for information extraction from digital news archives and multi step question answering systems, proposing novel methods to optimize information retrieval processes. However, the findings also highlight the potential for future research, particularly in the applicability of the event graph model to larger datasets and the exploration of cost performance trade-offs in language models.
Benzer Tezler
- Uçuş emniyeti açısından yolcuların alkol kullanımı
A study on passenger's alcohol use in flight safety
HATİCE DODAK
- Between cosmopolitan and national outlook: The BBC world news' coverage of the Syrian refugee crisis
Kozmopolitan ve ulusal bakış arasında: BBC world news'ün Suriyeli mülteci krizini haberleştirmesi
SERGÜL NGUYEN
Doktora
İngilizce
2021
İletişim BilimleriGalatasaray ÜniversitesiRadyo Televizyon ve Sinema Ana Bilim Dalı
PROF. DR. İNCİ ÇINARLI
- Exploiting information extraction techniques for automatic semantic annotation and retrieval of news videos in Turkish
Türkçe haber videolarının otomatik anlamsal etiketlenmeleri ve erişimleri için bilgi çıkarım tekniklerinin kullanımı
DİLEK KÜÇÜK
Doktora
İngilizce
2011
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik ÜniversitesiBilgisayar Mühendisliği Bölümü
PROF. DR. ADNAN YAZICI
- Koronavirüs sürecinde yaşlıların ana haber bültenlerindeki temsili: ATV, FOX ve Show TV kanalları örneği
Representation of the elderly in the main news bulletin on TV during the Coronavirüs process: Example of ATV, FOX and Show TV channels
BÜŞRA KARAMAN
Yüksek Lisans
Türkçe
2022
GazetecilikTrabzon ÜniversitesiGazetecilik Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ESİN GHADIANI
- Göç ve öteki: Duygu politikaları açısından bir analiz
Migration and the other: An analysis through politics of emotions
AZİZE AYAZ
Yüksek Lisans
Türkçe
2023
Kamu YönetimiBursa Uludağ ÜniversitesiSiyaset Bilimi ve Kamu Yönetimi Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ELİF MADAKBAŞ GÜLENER