Türkçe için metin özetleme
Text summarization for Turkish
- Tez No: 222007
- Danışmanlar: PROF.DR. EŞREF ADALI
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Bilgi Erisimi, Metin Özetleme, Gövdeleme, Information Retrieval, Text Summarization, Stemming
- Yıl: 2007
- Dil: Türkçe
- Üniversite: İstanbul Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 97
Özet
Bilgi erisimi genel sekliyle, depolanmıs bilgi derleminden belirli bilgi gereksinimiyle ilgili bölümlere erisim yöntemine yönelik çalısma olarak tanımlanabilir. Bilgi erisiminin altkümelerinden biri olan metin özetleme, bir belgeyi girdi olarak alan ve çıktı olarak daha kısa, aslının yerine geçen ve onun en önemli içeriğini barındıran bir süreç olarak tanımlanabilir. Yüksek verimlilik, yüksek basarım ve düsük uygulama maliyeti bugünkü arastırmalarda ve pratik uygulamalarda genellikle istatistiksel yöntemlerin kullanılmasının sebebidir. Türkçe, sondan eklemeli ve kurallı yapısı, çok az miktarda kuralsız sözcük içermesi nedeniyle bilgi erisimi arastırmacılarının ilgisini çekmistir. Türkçenin bu özellikleri, Türkçe için yapılan tüm bilgi erisimi sistemlerinde gövdeleme islemine önem kazandırmıstır. Bu tezde, Türkçe için farklı metin özetleme yöntemleri tanıtılıp uygulanmıstır. Diğer tüm Türkçe bilgi erisimi sistemlerinde de gerekli olduğu gibi, Türkçenin sondan eklemeli yapısının gözetilmesi amacıyla farklı gövdeleme algoritmalarının özetleme basarımına etkisi incelenmistir. Basarımlarının daha yüksek olması amacıyla, gerçeklenen gövdeleme algoritmalarında sözcüklerin olası kök ve ek birlesimlerini üreten biçimbirimsel çözümleyici kullanılmıstır. Gövdelenmis bu sözcükler farklı özetleme yöntemleri aracılığıyla incelenip her yöntem için özette yer alacak cümleler belirlenmistir. Daha sonra bu yöntemlerin ürettiği sonuçlar birlestirilerek son özet olusturulmustur.
Özet (Çeviri)
Information retrieval can be broadly defined as the study of how to determine and retrieve the portions, which are relevant to particular information needs, from a corpus of stored information. One of the subsets of information retrieval is text summarization. Text summarization can be defined as the process which takes a document as input and outputs a shorter document which is condensed and can be used instead of the original. Today?s researches and practical applications about text summarization mostly use the early statistical methods because of high efficiency, high performance and low application cost of these approaches. In this study, different statistical methods for text summarization are described and developed for Turkish. The effect of different stemming algorithms on summarization efficiency has been studied for the aim of taking into consideration the agglutinative structure of Turkish, as it is necessary in all other information retrieval systems for this language. Morphological analyzer, which outputs the root and affix combinations of the input word, has been used in stemming algorithms to increase the efficiency of the text summarization. These stemmed words have been studied by different summarization methods and sentences which will be included in the summary have been chosen. In the end, the final summary has been created by combining the results of these methods.
Benzer Tezler
- Rule-based text summarization in Turkish
Türkçe için kural tabanlı metin özetleme
ÇAĞDAŞ CAN BİRANT
Doktora
İngilizce
2015
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolDokuz Eylül ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. YALÇIN ÇEBİ
- TR-SUM: A text summarizer for Turkish
TR-SUM: Türkçe için bir metin özetleyici
YİĞİT YÜKSEL
Yüksek Lisans
İngilizce
2021
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolDokuz Eylül ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. YALÇIN ÇEBİ
- Financial named entity recognition for turkish news texts
Türkçe haber metinlerinde finansal varlık ismi tanıma
DUYGU DİNÇ
Yüksek Lisans
İngilizce
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. ALİ HİKMET DOĞRU
PROF. DR. PINAR KARAGÖZ
- Big data storage and automated text summarization in turkish text
Dev veri depolama ve Türkçe metin için otomatik özetleme
ERDİNÇ AYSU
Yüksek Lisans
İngilizce
2018
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolIşık ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. OLCAY TANER YILDIZ
- Derin öğrenme ile metin özetleme
Text summarization with deep learning
BURAK ERHANDI
Yüksek Lisans
Türkçe
2020
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSakarya ÜniversitesiBilgisayar ve Bilişim Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ FATİH ÇALLI