Geri Dön

Paraphrase extraction from parallel news corpora

Paralel haber kaynaklarından eşanlamlı ifadeler ayıklama

  1. Tez No: 182092
  2. Yazar: BENGİ MİZRAHİ
  3. Danışmanlar: YRD. DOÇ. DR. DENİZ YÜRET
  4. Tez Türü: Yüksek Lisans
  5. Konular: Dilbilim, Mühendislik Bilimleri, Linguistics, Engineering Sciences
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2006
  8. Dil: İngilizce
  9. Üniversite: Koç Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Elektrik ve Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 55

Özet

Bir idafenin farklı sözcükler ve/veya grammer yapıları ile açıklanlamasına `açımlama' denir.Buna bir örnek şöyledir: ?Ali problemi çözdü.? ve ?Ali probleme çözüm buldu.? Bu tipaçımlamaları yakalayıp gruplamaya ise `açımlama çıkarma' denir. Açımlama veritabanlarıSoru Cevaplama Sistemleri, Metin Özetleme Sistemleri ve Otomatik Dil Çeviricileri için çokyararlı yapılardır. Örneğin, Soru Cevaplama Sistemleri soru yapısını farklı açımlamalar ileçoğaltıp anımsamasını yükseltebilir. Açımlama çıkarmak için ilk önce aynı olaydan bahsedenfarklı gazeteciler tarafından yazılmış farklı haber yazılarını eşleştiriyoruz. Daha sonra buhaber ikilileri içerisinde en çok benzeşen cümleleri yakalayıp eşleştiriyoruz. Son olarak bucümle ikililerinin içerisinde eşleşen açımlamalar bulmaya çalışıyoruz. Aynı olaydan bahsedenhaber yazıları bulma kesinlilik ortalamamız sıkı notlandırma ile 0.56, rahat notlandırma ile0.70. Cümle eşleme için 9 farklı ölçüm yöntemi denedik. Her ne kadar ortak kelime saymayöntemi, cümle eşlemede, ortalama n-gram kesinlilik ölçme yönteminden daha yüksekkesinlilik değerleri verdi ise de ikinci yöntem daha yararlı açımlamalar elde etti. Sadece doğruhaber ikileri ile sistem çalıştırıldığında 0.66 kesinlilik elde edildi.

Özet (Çeviri)

Different expressions of the same statement is said to be paraphrases of each other. Anexample is the phrases 'solved' and 'found a solution to' in 'Alice solved the problem' and'Alice found a solution to the problem'. Paraphrase Extraction is the method of finding andgrouping such paraphrases from free text. Finding equivalent paraphrases and structures canbe very beneficial in a number of NLP applications, such as Question Answering, MachineTranslation, and Multi-text Summarization, e.g. in Question Answering, alternative questionscan be created using alternative paraphrases. We attack the problem by first grouping newsarticles that describe the same event and then collecting sentence pairs from these articles thatare semantically close to each other, and then finally extracting paraphrases out of thesesentence pairs to learn paraphrase structures. The precision of finding two equivalentdocuments turned out to be 0.56 and 0.70 on average, when matching criterion was strict andflexible, respectively. We tried 9 different evaluation techniques for sentence-level matching.Although, exact word match count approach had a better precision value than the n-gramprecision count approaches, paraphrase extraction phase shows that the latter approachescatch sentence pairs with higher quality pairs for paraphrase extraction. Our system canextract paraphrases with 0.66 precision when only equivalent document pairs are used as atest set.

Benzer Tezler

  1. Multilingual distributed word representation using deeplearning

    Derin öğrenme ile çok dilli, dağıtılmış kelime temsilleri

    GIHAD SOHSAH

    Yüksek Lisans

    İngilizce

    İngilizce

    2016

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Şehir Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. ONUR GÜZEY

  2. للـعلَّامــةِ عبدِ القـادر چَلبي زاده الحنَفي (كان حياً سنة 1099ه)من أوَّلِ المخطوط إلى باب النَّـفقة(دراسةً وتحقيقاً)

    Elyazması eserinin başından nafaka bâbına kadar fakihlerin Allâme Abdulkâdir Çelebizâde el-Hanefî'ye (Ö. 1099 H.) olumlu tesirleri (İnceleme ve tahkik)

    JASSİM MOHAMMED AYYED AL-MASHHADANİ

    Yüksek Lisans

    Arapça

    Arapça

    2022

    DinÇankırı Karatekin Üniversitesi

    Temel İslam Bilimleri Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ Kutaiba Farhat

  3. Tanzimat Döneminde yayımlanan tercüme roman mukaddimeleri üzerine bir inceleme (1860-1896)

    A study on translated novel mukaddime published in the Tanzimat Period (1860-1896)

    GÜLBAHAR AKÇAKALE

    Yüksek Lisans

    Türkçe

    Türkçe

    2021

    Türk Dili ve EdebiyatıManisa Celal Bayar Üniversitesi

    Türk Dili ve Edebiyatı Ana Bilim Dalı

    DOÇ. DR. H. HARİKA DURGUN

  4. Çıkarıcı Türkçe metin özetleme performansını iyileştirmek için yeni yöntemler

    New methods for improving the performance of extractive Turkish text summarization

    SALİH BAL

    Doktora

    Türkçe

    Türkçe

    2022

    Elektrik ve Elektronik MühendisliğiEskişehir Osmangazi Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ EFNAN ŞORA GÜNAL

  5. Paraphrase identification in turkish using distributed representations of words and sentences

    Dağıtık kelime ve cümle temsilleri kullanılarak türkçe eşanlatım tespiti

    HAKKI ENGİN YORGANCIOĞLU

    Yüksek Lisans

    İngilizce

    İngilizce

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolEge Üniversitesi

    Uluslararası Bilgisayar Ana Bilim Dalı

    PROF. DR. BAHAR KARAOĞLAN