Geri Dön

Bilimsel makalelerin anlamsal ilişki tabanlı özetlenmesi

Semantic relations-based summarizing of scientific articles

  1. Tez No: 905203
  2. Yazar: MEHTAP ÜLKER
  3. Danışmanlar: PROF. DR. AHMET BEDRİ ÖZER
  4. Tez Türü: Doktora
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2024
  8. Dil: Türkçe
  9. Üniversite: Fırat Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 100

Özet

Metin özetleme, araştırmacıların bir dokümanı olabildiğince hızlı bir şekilde algılaması açısından oldukça önemdir. Doküman önemli cümlelerin çıkarılması ya da metni yeniden yazmaya dayalı yaklaşımlarla özetlenmektedir. Derin öğrenme teknolojilerin gelişmesiyle birlikte, dokümanlar tıpkı bir insan tarafından üretilmiş gibi metnin başından başlayarak kelimeler arasında anlamsal ilişki kurularak özetlenmektedir. Bu yaklaşım, soyutlamalı özetleme olarak bilinmektedir. Soyutlamalı özetleme, bilimsel makalelerin yapısı gereğince uzun dokümanlar kategorisinde olması ve sürekli yenilik içeren güncel terminolojik kelimeler içermesi bakımından kelimeler arasında anlamsal içeriğin korunmaması açısından bilimsel makaleleri özetlenmesini zorlaştırmaktadır. Bilimsel makaleleri özetlemek için bu tez kapsamında iki farklı model önerilmiştir. Graf tabanlı yöntemle önerilen metin özetleme modelinde bilgisayar bilimi ile alakalı makalelerin özetlenmesi gerçekleştirilmiştir. Bu modelde, doküman için belirli kelime sınırı koyulmamıştır. Bilimsel makalelerden çıkarılan varlık isimleri ve ilişkiler doküman içeriğiyle birleştirilerek oluşturulan modelde özet üretimi gerçekleştirilmiştir. Önerilen model, bilimsel makaleleri özetlemede temel modellerle karşılaştırıldığında üstün performans göstermiştir. Diğer çalışmamızda, bilimsel makaleler olabildiğince az fakat önemli kelimelerle özetlenmesi amaçlanmıştır. Bunun için dokümandaki en önemli kelimelerin çıkarımıyla bir model geliştirilmiştir. Önerilen yöntem temel modellerle karşılaştırıldığında olabildiğince az ve önemli olan kelimelerle yazar tarafından yazılmış özetler gibi başarılı özetler üretilmiştir.

Özet (Çeviri)

Text summarization is a very important method for researchers to grasp a document as quickly as possible. The document is summarized with approaches based on the removal of important sentences or rewriting the text. With the development of deep learning technologies, documents are summarized by extracting semantic relationships between words starting from the beginning of the text, just as if they were produced by a human. This approach is known as abstractive summarization. Abstractive summarization makes it difficult to summarize scientific articles in terms of preserving the semantic content between the words, as scientific articles are in the category of long documents due to their structure and contain up-to-date terminological words that are constantly innovating. In this thesis, two different models are proposed to summarize scientific articles. In the proposed text summarization model with graph-based method, the summarization of articles related to computer science is performed. In this model, there is no token limit for the document. Summary generation was performed in the model by combining the entity names and relations extracted from scientific articles with the document content. The proposed model has shown superior performance in summarizing scientific articles compared to the baseline models. In other studies, scientific articles were summarized with as few but important words as possible. A novel model was developed by extracting the most important words in the document. When the proposed method was compared with the basic models, successful summaries were produced with as few and important words as possible, such as summaries written by the author.

Benzer Tezler

  1. Turkish morphological disambiguation using multiple conditional random fields

    Çoklu koşullu rassal alanlar kullanarak Türkçe biçimbilimsel belirsizlik giderme

    RAZIEH EHSANI

    Yüksek Lisans

    İngilizce

    İngilizce

    2013

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. EŞREF ADALI

    YRD. DOÇ. GÜLŞEN ERYİĞİT

  2. Identification of discourse relations in Turkish discourse bank

    Türkçe söylem bankasında söylem bağıntılarının belirlenmesi

    FERHAT KUTLU

    Doktora

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik Üniversitesi

    Bilişsel Bilim Ana Bilim Dalı

    PROF. DR. DENİZ ZEYREK BOZŞAHİN

    DR. MURATHAN KURFALI

  3. An ontology based representation of semantic annotations for biomedical relations extracted from scientific documents

    Bilimsel belgelerden çıkarılmış biyomedikal ilişkiler için anlamsal açıklamaların ontoloji temelli temsili

    BERKAY ATAMAN

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. SUSAN MICHELE ÜSKÜDARLI

  4. Kanıta dayalı tıp temelli soru yanıt sistemi

    A question answering system on evidence based medicine

    ALİRIZA ARIBAŞ

  5. Nahiv ilminde hilâf

    The controversy in Arabic grammar

    MEHMET AKINCI

    Doktora

    Türkçe

    Türkçe

    2024

    DilbilimÇanakkale Onsekiz Mart Üniversitesi

    Temel İslam Bilimleri Ana Bilim Dalı

    PROF. DR. RAMAZAN DEMİR