Automated text summarization and keyphrase extraction
Otomatik özet ve anahtar kelime çıkarma
- Tez No: 180632
- Danışmanlar: Y.DOÇ.DR. İLYAS ÇİÇEKLİ
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Automated Text Summarization, Keyphrase Extraction, LexicalChain, Lexical Cohesion, Natural Language Processing.iii
- Yıl: 2006
- Dil: İngilizce
- Üniversite: İhsan Doğramacı Bilkent Üniversitesi
- Enstitü: Mühendislik ve Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 116
Özet
üOZETü ËOTOMATIK OZET VE ANAHTAR KELIME CIKARMAşGünenş Ercano cBilgisayar Mühendisliği, Yüksek Lisansu g uËTez Yüneticisi: Yrd. Doş. Dr. Ilyas Cişeklio c şcEylül, 2006uElektronik dokümanların sayısı arttıkşa, onların bizim ihtiyaşlarımıza olanu c cüyakınlığını ülşebileceğimiz otomatik tekniklere ihtiyaş da artmaktadır. Ozetler,g oc g cËdokümanın kısa ve üz bir sunumu olarak kabul edilebilir. Ideal bir üzet işin,u o o cdokümanın tamamıyla anlaşılması cok ünemlidir. Ancak, bilgisayarların otomatiku s şoolarak dokümanı anlaması imkansız değil ise bile cok zordur. Bunun işin,u g ş cdokümandan ünemli kelime veya cümleleri seşmek ve bunları üzet olarak sun-u o u c omak, otomatik üzet cıkarma araştırmalarında sık kullanılan bir yüntemdir.o ş s oDokümandaki kelime bütünlüğu ünemli kelime veya cümleleri belirlemekteu u u ugü o ukullanılabilir. Kelime zincirleri, kelime bütünlüğunü analiz etmekte kul-u u ug ü ulanılabilecek bir araştır. Bu tezde kelime zincirleri kullanarak, otomatikcüzet ve anahtar kelime cıkarma calışmalarımız anlatılıyor. Bu tezde kelimeo ş şsbütünlüğunün, anahtar kelime bulmadaki etkileri bir üğreticiyle üğrenme pro-u u ug ü u og ogügramı aracılığıyla araştırılıyor. Ozet cıkarma sistemimiz bir dokümanın kelimeg s ş uzincirlerini cıkarıp, konuları kelime zincirlerinden kabaca bulup, yazıyı konuyaşgüre parşalara bülüp, en ünemli parşalardan cümle seşiyor. Anahtar kelimeo c ou o c u cbulma deneylerimizde, kelime bütünlüğunün anahtar kelime bulmanın başarısınıu u ug ü u sg o u us u üarttırdığı gürülmüştür. Ozet cıkarma sistemimiz diğer kelime bütünlüğu kullananş g u u ug üüzet sistemleriyle karşılaştırılınca, iyi sonuşlar almıştır.o ss c süAnahtar süzcükler : Otomatik Ozet Cıkarma, Anahtar Kelime Cıkarma, Kelimeou ş şËsZincirleri, Kelime Bütünlüğu, Doğal Dil Işleme.u u ug ü giv
Özet (Çeviri)
ABSTRACTAUTOMATED TEXT SUMMARIZATION ANDKEYPHRASE EXTRACTIONGünenş Ercano cM.S. in Computer EngineeringËSupervisor: Asst. Prof. Dr. Ilyas CişeklişcSeptember, 2006As the number of electronic documents increase rapidly, the need for faster tech-niques to asses the relevance of documents emerges. A summary can be consideredas a concise representation of the underlying text. To form an ideal summary, afull understanding of the document is essential. For computers, full understand-ing is diï¬cult, if not impossible. Thus, selecting important sentences from theoriginal text and presenting these sentences as a summary is a common techniquein automated text summarization research.The lexical cohesion structure of the text can be exploited to determine theimportance of a sentence/phrase. Lexical chains are useful tools to analyze thelexical cohesion structure in a text. This thesis discusses our research on auto-mated text summarization and keyphrase extraction using lexical chains. We in-vestigate the eï¬ect of the use of lexical cohesion features in keyphrase extraction,with a supervised machine learning algorithm. Our summarization algorithmconstructs the lexical chains, detects topics roughly from lexical chains, segmentsthe text with respect to the topics and selects the most important sentences. Ourexperiments show that lexical cohesion based features improve keyphrase extrac-tion. Our summarization algorithm has achieved good results, compared to someother lexical cohesion based algorithms.
Benzer Tezler
- Makine öğrenmesi ile Türkçe haber metinlerinde anahtar ifade çıkarımı
Keyphrase extraction for Turkish news text with machine learning methods
MUSTAFA ÇETİNGÖZ
Yüksek Lisans
Türkçe
2011
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolTrakya ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. ERDEM UÇAR
- Abstractive text summarization for morphologically rich languages
Biçimbilimsel açıdan zengin dillerde soyutlamalı metin özetleme
BATUHAN BAYKARA
Doktora
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. TUNGA GÜNGÖR
- Makine öğrenmesi kullanarak metin özetleme
Text summarization using machine learning
GÜLNİHAL UYKUN
Yüksek Lisans
Türkçe
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSüleyman Demirel ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. ARİF KOYUN
- Big data storage and automated text summarization in turkish text
Dev veri depolama ve Türkçe metin için otomatik özetleme
ERDİNÇ AYSU
Yüksek Lisans
İngilizce
2018
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolIşık ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. OLCAY TANER YILDIZ
- Analysis of word dependency relations and subword models in abstractive text summarization
Soyutlamalı metin özetlemede kelime bağlılık ilişkileri ve alt sözcük modelleri analizi
AHMET BEKA ÖZKAN
Yüksek Lisans
İngilizce
2021
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. TUNGA GÜNGÖR