Geri Dön

Automated text summarization and keyphrase extraction

Otomatik özet ve anahtar kelime çıkarma

  1. Tez No: 180632
  2. Yazar: GÖNENÇ ERCAN
  3. Danışmanlar: Y.DOÇ.DR. İLYAS ÇİÇEKLİ
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Automated Text Summarization, Keyphrase Extraction, LexicalChain, Lexical Cohesion, Natural Language Processing.iii
  7. Yıl: 2006
  8. Dil: İngilizce
  9. Üniversite: İhsan Doğramacı Bilkent Üniversitesi
  10. Enstitü: Mühendislik ve Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 116

Özet

üOZETü ˙OTOMATIK OZET VE ANAHTAR KELIME CIKARMAşGünenş Ercano cBilgisayar Mühendisliği, Yüksek Lisansu g u˙Tez Yüneticisi: Yrd. Doş. Dr. Ilyas Cişeklio c şcEylül, 2006uElektronik dokümanların sayısı arttıkşa, onların bizim ihtiyaşlarımıza olanu c cüyakınlığını ülşebileceğimiz otomatik tekniklere ihtiyaş da artmaktadır. Ozetler,g oc g c˙dokümanın kısa ve üz bir sunumu olarak kabul edilebilir. Ideal bir üzet işin,u o o cdokümanın tamamıyla anlaşılması cok ünemlidir. Ancak, bilgisayarların otomatiku s şoolarak dokümanı anlaması imkansız değil ise bile cok zordur. Bunun işin,u g ş cdokümandan ünemli kelime veya cümleleri seşmek ve bunları üzet olarak sun-u o u c omak, otomatik üzet cıkarma araştırmalarında sık kullanılan bir yüntemdir.o ş s oDokümandaki kelime bütünlüğu ünemli kelime veya cümleleri belirlemekteu u u ugü o ukullanılabilir. Kelime zincirleri, kelime bütünlüğunü analiz etmekte kul-u u ug ü ulanılabilecek bir araştır. Bu tezde kelime zincirleri kullanarak, otomatikcüzet ve anahtar kelime cıkarma calışmalarımız anlatılıyor. Bu tezde kelimeo ş şsbütünlüğunün, anahtar kelime bulmadaki etkileri bir üğreticiyle üğrenme pro-u u ug ü u og ogügramı aracılığıyla araştırılıyor. Ozet cıkarma sistemimiz bir dokümanın kelimeg s ş uzincirlerini cıkarıp, konuları kelime zincirlerinden kabaca bulup, yazıyı konuyaşgüre parşalara bülüp, en ünemli parşalardan cümle seşiyor. Anahtar kelimeo c ou o c u cbulma deneylerimizde, kelime bütünlüğunün anahtar kelime bulmanın başarısınıu u ug ü u sg o u us u üarttırdığı gürülmüştür. Ozet cıkarma sistemimiz diğer kelime bütünlüğu kullananş g u u ug üüzet sistemleriyle karşılaştırılınca, iyi sonuşlar almıştır.o ss c süAnahtar süzcükler : Otomatik Ozet Cıkarma, Anahtar Kelime Cıkarma, Kelimeou ş şË™sZincirleri, Kelime Bütünlüğu, Doğal Dil Işleme.u u ug ü giv

Özet (Çeviri)

ABSTRACTAUTOMATED TEXT SUMMARIZATION ANDKEYPHRASE EXTRACTIONGünenş Ercano cM.S. in Computer Engineering˙Supervisor: Asst. Prof. Dr. Ilyas CişeklişcSeptember, 2006As the number of electronic documents increase rapidly, the need for faster tech-niques to asses the relevance of documents emerges. A summary can be consideredas a concise representation of the underlying text. To form an ideal summary, afull understanding of the document is essential. For computers, full understand-ing is difficult, if not impossible. Thus, selecting important sentences from theoriginal text and presenting these sentences as a summary is a common techniquein automated text summarization research.The lexical cohesion structure of the text can be exploited to determine theimportance of a sentence/phrase. Lexical chains are useful tools to analyze thelexical cohesion structure in a text. This thesis discusses our research on auto-mated text summarization and keyphrase extraction using lexical chains. We in-vestigate the effect of the use of lexical cohesion features in keyphrase extraction,with a supervised machine learning algorithm. Our summarization algorithmconstructs the lexical chains, detects topics roughly from lexical chains, segmentsthe text with respect to the topics and selects the most important sentences. Ourexperiments show that lexical cohesion based features improve keyphrase extrac-tion. Our summarization algorithm has achieved good results, compared to someother lexical cohesion based algorithms.

Benzer Tezler

  1. Makine öğrenmesi ile Türkçe haber metinlerinde anahtar ifade çıkarımı

    Keyphrase extraction for Turkish news text with machine learning methods

    MUSTAFA ÇETİNGÖZ

    Yüksek Lisans

    Türkçe

    Türkçe

    2011

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolTrakya Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. ERDEM UÇAR

  2. Abstractive text summarization for morphologically rich languages

    Biçimbilimsel açıdan zengin dillerde soyutlamalı metin özetleme

    BATUHAN BAYKARA

    Doktora

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. TUNGA GÜNGÖR

  3. Makine öğrenmesi kullanarak metin özetleme

    Text summarization using machine learning

    GÜLNİHAL UYKUN

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSüleyman Demirel Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ARİF KOYUN

  4. Big data storage and automated text summarization in turkish text

    Dev veri depolama ve Türkçe metin için otomatik özetleme

    ERDİNÇ AYSU

    Yüksek Lisans

    İngilizce

    İngilizce

    2018

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolIşık Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. OLCAY TANER YILDIZ

  5. Analysis of word dependency relations and subword models in abstractive text summarization

    Soyutlamalı metin özetlemede kelime bağlılık ilişkileri ve alt sözcük modelleri analizi

    AHMET BEKA ÖZKAN

    Yüksek Lisans

    İngilizce

    İngilizce

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. TUNGA GÜNGÖR