An evaluation of automatic text summarization techniques
Otomatik metin özetleme tekniklerinin değerlendirilmesi
- Tez No: 585926
- Danışmanlar: DR. ÖĞR. ÜYESİ TEVFİK AYTEKİN
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Metin Özetleme Teknikleri, Derin Öğrenme, Dil Modelleme, Doğal Dil İşleme, Text Summarization Techniques, Deep Learning, Language Modelling, Natural Language Processing
- Yıl: 2019
- Dil: İngilizce
- Üniversite: Bahçeşehir Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 90
Özet
İnsanoğlunun varoluşundan itibaren ürettiği anlamlı sesler dizisi ve bu dizilerin yazılı olarak ifade edildiği kurallar bütününe doğal dil denir. Dil insan zekasının göstergesi olan en önemli iletişim protokolüdür. Bu protokolü işletebilmek için beynimizin neocortex kısmında oldukça karmaşık işlemler gerçekleşir. Neocortex elde ettiği veriyi işlemede oldukça başarılı olsa da günden güne artan veri yoğunluğu veri içinden anlamlı kısmı bulup çıkarmasını güçleştiriyor. Veri yığınları arasından önemli kısımları bulmak oldukça zaman alıyor. Bize lazım olan anlamlı bilgiye kısa zamanda nasıl ulaşabiliriz sorusunun cevabı metin özetlemedir. Basitçe, verilen uzun bir metinden doğal dil işleme (NLP) tekniklerini kullanarak metni temsil eden anlamlı bir özet çıkarma işlemine metin özetleme denir. Özet oluşturma işleminin birçok uygulama alanı bulunmakta, örneğin makale özetleme, hava durumu tahmin sistemleri, haber, finans verilerinin okunabilir hale getirilmesi gibi. Geçmişte birçok özetleme uygulaması çıkarım yöntemleri kullanılarak yapılmaktaydı. Çıkarım metin özetleme teknikleri, metin içinden var olan cümlelerin seçilmesine dayanıyor. Çıkarım yöntemleri kullanılarak başarılı çözümler uygulanabiliyor. Fakat insanlar özetleme konusunda çıkarım özetleme tekniklerinden çok daha fazlasını yapabiliyor. Bir metni özetlemeye çalıştığımızda beynimiz metnin semantik gösterimini oluşturuyor. Bu gösterimden ise özet çıkartıyoruz. Buna soyut eğilimli yöntem diyoruz. Bu tez çalışmasında doğal dil işleme, çıkarım ve soyut eğilimli yöntemler kullanarak metin özetleme işleminin nasıl gerçekleştiği araştırılmıştır. Yöntemler arasında farklar değerlendirilerek yorumlanmaktadır.
Özet (Çeviri)
From the beginning of mankind's existence, the series of meaningful voices produced and the rules in which these sequences are written are called natural language. Language is the most important communication protocol that representation of human intelligence. In order to operate this protocol, quite complex transactions are taking place at the neocortex part of our brain. Even though Neocortex is very successful in processing the data obtains, the increasing data density makes it difficult to find the meaningful part within the data. It takes so much time to find important parts from the heaps of data. The answer to the question of how we can reach meaningful information in a short time is text summarization. Simply, text summarization is the process of shortening long texts by using natural language (NLP) techniques. There is various application areas of summarization processes, for instance article summarization or making weather forecast systems, news and financial data readable. In the past, many summarizing practices were made using extractive methods. Extractive text summarization techniques are based on the selection of existing sentences within the text. Successful solutions can be applied using extractive methods. But humans can do more than extractive techniques for summarizing. When we try to summarize a text, our brain forms the semantic representation of the text. We are summarizing from this representation. This is called the abstractive method. In this thesis, summarizing text using natural language processing, extractive and abstractive methods are investigated. Differences between methods are being evaluated and interpreted.
Benzer Tezler
- Extractive text summarization for Turkish using TF-IDF and pagerank algorithms
TF-IDF ve pagerank algoritmaları kullanılarak Türkçe için text özetleme
EMRE AKÜLKER
Yüksek Lisans
İngilizce
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAtılım ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. ÇİĞDEM TURHAN
- Otomatik metin özetleme sistemi
Automatic tex summarization system
AYSUN GÜRAN
Doktora
Türkçe
2013
MatematikYıldız Teknik ÜniversitesiMatematik Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. NİLGÜN GÜLER BAYAZIT
- Metin çizgelerinde entropi ve optimizasyon tabanlı çıkarımsal metin özetleme
Entropy and optimization based extractive text summarization in text graphs
CENGİZ HARK
Doktora
Türkçe
2020
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİnönü ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. ALİ KARCI
- Bilgisayar bilimleri alanında yapılan Türkçe akademik yayınların doğal dil işleme yöntemleri ile incelenmesi
Analysing Turkish academic papers in computer science using natural language processing techniques
CANER KARA
Doktora
Türkçe
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSüleyman Demirel ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. ECİR UĞUR KÜÇÜKSİLLE
- Automated query-biased and structure-preserving document summarization for web search tasks
Arama motorları için bilgi isteğine ve metin yapısına dayalı olarak otomatik doküman özetlenmesi
FATMA CANAN PEMBE
Doktora
İngilizce
2010
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. TUNGA GÜNGÖR