Bilimsel makalelerin anlamsal ilişki tabanlı özetlenmesi
Semantic relations-based summarizing of scientific articles
- Tez No: 905203
- Danışmanlar: PROF. DR. AHMET BEDRİ ÖZER
- Tez Türü: Doktora
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2024
- Dil: Türkçe
- Üniversite: Fırat Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 100
Özet
Metin özetleme, araştırmacıların bir dokümanı olabildiğince hızlı bir şekilde algılaması açısından oldukça önemdir. Doküman önemli cümlelerin çıkarılması ya da metni yeniden yazmaya dayalı yaklaşımlarla özetlenmektedir. Derin öğrenme teknolojilerin gelişmesiyle birlikte, dokümanlar tıpkı bir insan tarafından üretilmiş gibi metnin başından başlayarak kelimeler arasında anlamsal ilişki kurularak özetlenmektedir. Bu yaklaşım, soyutlamalı özetleme olarak bilinmektedir. Soyutlamalı özetleme, bilimsel makalelerin yapısı gereğince uzun dokümanlar kategorisinde olması ve sürekli yenilik içeren güncel terminolojik kelimeler içermesi bakımından kelimeler arasında anlamsal içeriğin korunmaması açısından bilimsel makaleleri özetlenmesini zorlaştırmaktadır. Bilimsel makaleleri özetlemek için bu tez kapsamında iki farklı model önerilmiştir. Graf tabanlı yöntemle önerilen metin özetleme modelinde bilgisayar bilimi ile alakalı makalelerin özetlenmesi gerçekleştirilmiştir. Bu modelde, doküman için belirli kelime sınırı koyulmamıştır. Bilimsel makalelerden çıkarılan varlık isimleri ve ilişkiler doküman içeriğiyle birleştirilerek oluşturulan modelde özet üretimi gerçekleştirilmiştir. Önerilen model, bilimsel makaleleri özetlemede temel modellerle karşılaştırıldığında üstün performans göstermiştir. Diğer çalışmamızda, bilimsel makaleler olabildiğince az fakat önemli kelimelerle özetlenmesi amaçlanmıştır. Bunun için dokümandaki en önemli kelimelerin çıkarımıyla bir model geliştirilmiştir. Önerilen yöntem temel modellerle karşılaştırıldığında olabildiğince az ve önemli olan kelimelerle yazar tarafından yazılmış özetler gibi başarılı özetler üretilmiştir.
Özet (Çeviri)
Text summarization is a very important method for researchers to grasp a document as quickly as possible. The document is summarized with approaches based on the removal of important sentences or rewriting the text. With the development of deep learning technologies, documents are summarized by extracting semantic relationships between words starting from the beginning of the text, just as if they were produced by a human. This approach is known as abstractive summarization. Abstractive summarization makes it difficult to summarize scientific articles in terms of preserving the semantic content between the words, as scientific articles are in the category of long documents due to their structure and contain up-to-date terminological words that are constantly innovating. In this thesis, two different models are proposed to summarize scientific articles. In the proposed text summarization model with graph-based method, the summarization of articles related to computer science is performed. In this model, there is no token limit for the document. Summary generation was performed in the model by combining the entity names and relations extracted from scientific articles with the document content. The proposed model has shown superior performance in summarizing scientific articles compared to the baseline models. In other studies, scientific articles were summarized with as few but important words as possible. A novel model was developed by extracting the most important words in the document. When the proposed method was compared with the basic models, successful summaries were produced with as few and important words as possible, such as summaries written by the author.
Benzer Tezler
- Turkish morphological disambiguation using multiple conditional random fields
Çoklu koşullu rassal alanlar kullanarak Türkçe biçimbilimsel belirsizlik giderme
RAZIEH EHSANI
Yüksek Lisans
İngilizce
2013
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. EŞREF ADALI
YRD. DOÇ. GÜLŞEN ERYİĞİT
- Identification of discourse relations in Turkish discourse bank
Türkçe söylem bankasında söylem bağıntılarının belirlenmesi
FERHAT KUTLU
Doktora
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik ÜniversitesiBilişsel Bilim Ana Bilim Dalı
PROF. DR. DENİZ ZEYREK BOZŞAHİN
DR. MURATHAN KURFALI
- An ontology based representation of semantic annotations for biomedical relations extracted from scientific documents
Bilimsel belgelerden çıkarılmış biyomedikal ilişkiler için anlamsal açıklamaların ontoloji temelli temsili
BERKAY ATAMAN
Yüksek Lisans
İngilizce
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. SUSAN MICHELE ÜSKÜDARLI
- Kanıta dayalı tıp temelli soru yanıt sistemi
A question answering system on evidence based medicine
ALİRIZA ARIBAŞ
Yüksek Lisans
Türkçe
2018
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolDokuz Eylül ÜniversitesiDOÇ. DR. ADİL ALPKOÇAK
- Nahiv ilminde hilâf
The controversy in Arabic grammar
MEHMET AKINCI
Doktora
Türkçe
2024
DilbilimÇanakkale Onsekiz Mart ÜniversitesiTemel İslam Bilimleri Ana Bilim Dalı
PROF. DR. RAMAZAN DEMİR