Geri Dön

Multi-document summarization using dependency grammars

Bağımsal dilbilgisi kullanarak çoklu doküman özetleme

  1. Tez No: 371824
  2. Yazar: ŞAZİYE BETÜL BİLGİN
  3. Danışmanlar: YRD. DOÇ. DR. ARZUCAN ÖZGÜR TÜRKMEN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2014
  8. Dil: İngilizce
  9. Üniversite: Boğaziçi Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 70

Özet

İnternet ortamındaki elektronik belgelerin sayısındaki hızlı artış, bilgi yükü problemini de beraberinde getirmistir. Otomatik çoklu doküman özetleme bu problemi çözmede gelecek vaadeden yöntemlerden biridir. Otomatik çoklu doküman özetleme için temelde iki yaklaşım vardır. Bunlar özetlenecek metinlerden önemli cümlelerin çeşitli yöntemlerle seçilmesi ile özet oluşturan cümle seçerek özetleme ve özetleme işini doğal dil işleme metotları kullanarak metinlerden yeni cümlelerin oluşturulmasıyla yapan yorumlayarak özetleme yaklaşımlarıdır. Cümle seçerek özetleme yöntemlerinin büyük bir kısmında cümleler arası benzerlik bulma işi önemli bir yer tutar. Bu çalışmada, bağımsal dilbilgisini cümleler arası benzerlik bulma probleminde kullandık ve oluşturduğumuz benzerlik yöntemini cümle seçerek çoklu doküman özetleme işine uyguladık. Bu iş için iki farklı bağımsal ağaç bazlı cümleler arası benzerlik bulma yöntemi kullandık. İlk olarak ilişki çıkarımı için önerilmiş bu yöntemler hesaplamalarında bağımsal dilbilgisindeki bağıntıların türlerinden yararlanmıyorlardı. Bu metotlarla çalıştıktan sonra bağıntıların türlerini de hesaba katan bir dizi yeni bağımsal dilbilgisi bazlı cümleler arası benzerlik bulma yöntemi geliştirdik. Tasarlanan bu yöntemler diğer iki yöntemden daha iyi sonuç verdiler. Bu çalışma sonucunda cümleler arası benzerlik bulmada bağımsal dilbilgisi kullanımının başarılı sonuçlar verdiğini gördük. Cümleleri bağımsal ağaç yapısını kullanarak göstermenin cümleler arasındaki benzer kısımları bulmakta iyi sonuç verdiğini gözlemledik. Ayrıca bağımsal ağaçlardaki bağıntıların türlerinin cümlelerdeki önemli kısımların bulunmasında önemli rol oynadığı sonucuna vardık.

Özet (Çeviri)

Information overload is one of the greatest challenges in recent years, especially due to the rapid increase of data produced on the Internet. Automatic summarization of documents about similar topics is a salient solution to overcome this problem. There are mainly two approaches for this task, extractive multi-document summarization where the summary is created by selecting salient sentences from documents, and abstractive multi-document summarization where new sentences are generated using natural language generation methods. Sentence similarity calculation is significant in most of the extractive multi-document summarization approaches. In this study we introduce usage of dependency grammars to compute sentence similarity for extractive multi-document summarization problem. We adapt and investigate the effects of two untyped dependency tree based sentence similarity kernels, which have originally been proposed for relation extraction, to multi-document summarization problem. In addition, we propose a series of new dependency grammar based kernels to better represent the syntactic and semantic similarities among the sentences. The proposed methods incorporate type information of dependency relations for sentence similarity calculation. Our best method achieves significantly better scores than the untyped dependency tree based kernels. We observe that using dependency grammar representation of sentences leads better results in finding the similarities between sentences and the type of dependency relations is crucial in identifying the important parts in sentences.

Benzer Tezler

  1. Türkçe eşgönderge çözümlemesi

    Turkish coreference resolution

    TUĞBA PAMAY

    Yüksek Lisans

    Türkçe

    Türkçe

    2018

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ GÜLŞEN ERYİĞİT

  2. Multi̇-document summarization using distortion-rate ratio

    Bozulum-hız oranına göre çoklu metin özetinin çıkarılması

    ULUKBEK ATTOKUROV

    Yüksek Lisans

    İngilizce

    İngilizce

    2014

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. ULUĞ BAYAZIT

  3. Özgün paragraf tabanlı çıkarım tekniği kullanarak otomatik çoklu doküman özetleme

    Automatic multi-document summarization using original paragraph based extraction technique

    METİN TURAN

    Doktora

    Türkçe

    Türkçe

    2015

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolYıldız Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. AHMET COŞKUN SÖNMEZ

  4. Language independent multi document summarization using latent semantic indexing/clustering techniques

    Saklı anlam indeksleme ve kümeleme teknikleri ile dilden bağımsız çoklu doküman özetleme

    SUAT ALİM

    Yüksek Lisans

    İngilizce

    İngilizce

    2009

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolÇankaya Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ABDÜL KADİR GÖRÜR

  5. Enhancing feature selection with contextual relatedness filtering using Wikipedia

    Wikipedia yolu ile bağlamsal ilişki filtrelemesi kullanarak geliştirilmiş özellik seçme

    MELİH BAYDAR

    Yüksek Lisans

    İngilizce

    İngilizce

    2017

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİhsan Doğramacı Bilkent Üniversitesi

    Bilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı

    PROF. FAZLI CAN