Geri Dön

An evaluation of automatic text summarization techniques

Otomatik metin özetleme tekniklerinin değerlendirilmesi

  1. Tez No: 585926
  2. Yazar: MURAT GÜMÜŞ
  3. Danışmanlar: DR. ÖĞR. ÜYESİ TEVFİK AYTEKİN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Metin Özetleme Teknikleri, Derin Öğrenme, Dil Modelleme, Doğal Dil İşleme, Text Summarization Techniques, Deep Learning, Language Modelling, Natural Language Processing
  7. Yıl: 2019
  8. Dil: İngilizce
  9. Üniversite: Bahçeşehir Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 90

Özet

İnsanoğlunun varoluşundan itibaren ürettiği anlamlı sesler dizisi ve bu dizilerin yazılı olarak ifade edildiği kurallar bütününe doğal dil denir. Dil insan zekasının göstergesi olan en önemli iletişim protokolüdür. Bu protokolü işletebilmek için beynimizin neocortex kısmında oldukça karmaşık işlemler gerçekleşir. Neocortex elde ettiği veriyi işlemede oldukça başarılı olsa da günden güne artan veri yoğunluğu veri içinden anlamlı kısmı bulup çıkarmasını güçleştiriyor. Veri yığınları arasından önemli kısımları bulmak oldukça zaman alıyor. Bize lazım olan anlamlı bilgiye kısa zamanda nasıl ulaşabiliriz sorusunun cevabı metin özetlemedir. Basitçe, verilen uzun bir metinden doğal dil işleme (NLP) tekniklerini kullanarak metni temsil eden anlamlı bir özet çıkarma işlemine metin özetleme denir. Özet oluşturma işleminin birçok uygulama alanı bulunmakta, örneğin makale özetleme, hava durumu tahmin sistemleri, haber, finans verilerinin okunabilir hale getirilmesi gibi. Geçmişte birçok özetleme uygulaması çıkarım yöntemleri kullanılarak yapılmaktaydı. Çıkarım metin özetleme teknikleri, metin içinden var olan cümlelerin seçilmesine dayanıyor. Çıkarım yöntemleri kullanılarak başarılı çözümler uygulanabiliyor. Fakat insanlar özetleme konusunda çıkarım özetleme tekniklerinden çok daha fazlasını yapabiliyor. Bir metni özetlemeye çalıştığımızda beynimiz metnin semantik gösterimini oluşturuyor. Bu gösterimden ise özet çıkartıyoruz. Buna soyut eğilimli yöntem diyoruz. Bu tez çalışmasında doğal dil işleme, çıkarım ve soyut eğilimli yöntemler kullanarak metin özetleme işleminin nasıl gerçekleştiği araştırılmıştır. Yöntemler arasında farklar değerlendirilerek yorumlanmaktadır.

Özet (Çeviri)

From the beginning of mankind's existence, the series of meaningful voices produced and the rules in which these sequences are written are called natural language. Language is the most important communication protocol that representation of human intelligence. In order to operate this protocol, quite complex transactions are taking place at the neocortex part of our brain. Even though Neocortex is very successful in processing the data obtains, the increasing data density makes it difficult to find the meaningful part within the data. It takes so much time to find important parts from the heaps of data. The answer to the question of how we can reach meaningful information in a short time is text summarization. Simply, text summarization is the process of shortening long texts by using natural language (NLP) techniques. There is various application areas of summarization processes, for instance article summarization or making weather forecast systems, news and financial data readable. In the past, many summarizing practices were made using extractive methods. Extractive text summarization techniques are based on the selection of existing sentences within the text. Successful solutions can be applied using extractive methods. But humans can do more than extractive techniques for summarizing. When we try to summarize a text, our brain forms the semantic representation of the text. We are summarizing from this representation. This is called the abstractive method. In this thesis, summarizing text using natural language processing, extractive and abstractive methods are investigated. Differences between methods are being evaluated and interpreted.

Benzer Tezler

  1. Extractive text summarization for Turkish using TF-IDF and pagerank algorithms

    TF-IDF ve pagerank algoritmaları kullanılarak Türkçe için text özetleme

    EMRE AKÜLKER

    Yüksek Lisans

    İngilizce

    İngilizce

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAtılım Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. ÇİĞDEM TURHAN

  2. Otomatik metin özetleme sistemi

    Automatic tex summarization system

    AYSUN GÜRAN

    Doktora

    Türkçe

    Türkçe

    2013

    MatematikYıldız Teknik Üniversitesi

    Matematik Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. NİLGÜN GÜLER BAYAZIT

  3. Metin çizgelerinde entropi ve optimizasyon tabanlı çıkarımsal metin özetleme

    Entropy and optimization based extractive text summarization in text graphs

    CENGİZ HARK

    Doktora

    Türkçe

    Türkçe

    2020

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİnönü Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. ALİ KARCI

  4. Bilgisayar bilimleri alanında yapılan Türkçe akademik yayınların doğal dil işleme yöntemleri ile incelenmesi

    Analysing Turkish academic papers in computer science using natural language processing techniques

    CANER KARA

    Doktora

    Türkçe

    Türkçe

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSüleyman Demirel Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. ECİR UĞUR KÜÇÜKSİLLE

  5. Automated query-biased and structure-preserving document summarization for web search tasks

    Arama motorları için bilgi isteğine ve metin yapısına dayalı olarak otomatik doküman özetlenmesi

    FATMA CANAN PEMBE

    Doktora

    İngilizce

    İngilizce

    2010

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. TUNGA GÜNGÖR