Paraphrase extraction from parallel news corpora
Paralel haber kaynaklarından eşanlamlı ifadeler ayıklama
- Tez No: 182092
- Danışmanlar: YRD. DOÇ. DR. DENİZ YÜRET
- Tez Türü: Yüksek Lisans
- Konular: Dilbilim, Mühendislik Bilimleri, Linguistics, Engineering Sciences
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2006
- Dil: İngilizce
- Üniversite: Koç Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Elektrik ve Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 55
Özet
Bir idafenin farklı sözcükler ve/veya grammer yapıları ile açıklanlamasına `açımlama' denir.Buna bir örnek şöyledir: ?Ali problemi çözdü.? ve ?Ali probleme çözüm buldu.? Bu tipaçımlamaları yakalayıp gruplamaya ise `açımlama çıkarma' denir. Açımlama veritabanlarıSoru Cevaplama Sistemleri, Metin Özetleme Sistemleri ve Otomatik Dil Çeviricileri için çokyararlı yapılardır. Örneğin, Soru Cevaplama Sistemleri soru yapısını farklı açımlamalar ileçoğaltıp anımsamasını yükseltebilir. Açımlama çıkarmak için ilk önce aynı olaydan bahsedenfarklı gazeteciler tarafından yazılmış farklı haber yazılarını eşleştiriyoruz. Daha sonra buhaber ikilileri içerisinde en çok benzeşen cümleleri yakalayıp eşleştiriyoruz. Son olarak bucümle ikililerinin içerisinde eşleşen açımlamalar bulmaya çalışıyoruz. Aynı olaydan bahsedenhaber yazıları bulma kesinlilik ortalamamız sıkı notlandırma ile 0.56, rahat notlandırma ile0.70. Cümle eşleme için 9 farklı ölçüm yöntemi denedik. Her ne kadar ortak kelime saymayöntemi, cümle eşlemede, ortalama n-gram kesinlilik ölçme yönteminden daha yüksekkesinlilik değerleri verdi ise de ikinci yöntem daha yararlı açımlamalar elde etti. Sadece doğruhaber ikileri ile sistem çalıştırıldığında 0.66 kesinlilik elde edildi.
Özet (Çeviri)
Different expressions of the same statement is said to be paraphrases of each other. Anexample is the phrases 'solved' and 'found a solution to' in 'Alice solved the problem' and'Alice found a solution to the problem'. Paraphrase Extraction is the method of finding andgrouping such paraphrases from free text. Finding equivalent paraphrases and structures canbe very beneficial in a number of NLP applications, such as Question Answering, MachineTranslation, and Multi-text Summarization, e.g. in Question Answering, alternative questionscan be created using alternative paraphrases. We attack the problem by first grouping newsarticles that describe the same event and then collecting sentence pairs from these articles thatare semantically close to each other, and then finally extracting paraphrases out of thesesentence pairs to learn paraphrase structures. The precision of finding two equivalentdocuments turned out to be 0.56 and 0.70 on average, when matching criterion was strict andflexible, respectively. We tried 9 different evaluation techniques for sentence-level matching.Although, exact word match count approach had a better precision value than the n-gramprecision count approaches, paraphrase extraction phase shows that the latter approachescatch sentence pairs with higher quality pairs for paraphrase extraction. Our system canextract paraphrases with 0.66 precision when only equivalent document pairs are used as atest set.
Benzer Tezler
- Multilingual distributed word representation using deeplearning
Derin öğrenme ile çok dilli, dağıtılmış kelime temsilleri
GIHAD SOHSAH
Yüksek Lisans
İngilizce
2016
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Şehir ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. ONUR GÜZEY
- للـعلَّامــةِ عبدِ القـادر چَلبي زاده الحنَفي (كان حياً سنة 1099ه)من أوَّلِ المخطوط إلى باب النَّـفقة(دراسةً وتحقيقاً)
Elyazması eserinin başından nafaka bâbına kadar fakihlerin Allâme Abdulkâdir Çelebizâde el-Hanefî'ye (Ö. 1099 H.) olumlu tesirleri (İnceleme ve tahkik)
JASSİM MOHAMMED AYYED AL-MASHHADANİ
Yüksek Lisans
Arapça
2022
DinÇankırı Karatekin ÜniversitesiTemel İslam Bilimleri Ana Bilim Dalı
DR. ÖĞR. ÜYESİ Kutaiba Farhat
- Tanzimat Döneminde yayımlanan tercüme roman mukaddimeleri üzerine bir inceleme (1860-1896)
A study on translated novel mukaddime published in the Tanzimat Period (1860-1896)
GÜLBAHAR AKÇAKALE
Yüksek Lisans
Türkçe
2021
Türk Dili ve EdebiyatıManisa Celal Bayar ÜniversitesiTürk Dili ve Edebiyatı Ana Bilim Dalı
DOÇ. DR. H. HARİKA DURGUN
- Çıkarıcı Türkçe metin özetleme performansını iyileştirmek için yeni yöntemler
New methods for improving the performance of extractive Turkish text summarization
SALİH BAL
Doktora
Türkçe
2022
Elektrik ve Elektronik MühendisliğiEskişehir Osmangazi ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ EFNAN ŞORA GÜNAL
- Paraphrase identification in turkish using distributed representations of words and sentences
Dağıtık kelime ve cümle temsilleri kullanılarak türkçe eşanlatım tespiti
HAKKI ENGİN YORGANCIOĞLU
Yüksek Lisans
İngilizce
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolEge ÜniversitesiUluslararası Bilgisayar Ana Bilim Dalı
PROF. DR. BAHAR KARAOĞLAN