Paraphrase identification in turkish using distributed representations of words and sentences
Dağıtık kelime ve cümle temsilleri kullanılarak türkçe eşanlatım tespiti
- Tez No: 611140
- Danışmanlar: PROF. DR. BAHAR KARAOĞLAN
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2019
- Dil: İngilizce
- Üniversite: Ege Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Uluslararası Bilgisayar Ana Bilim Dalı
- Bilim Dalı: Bilgi Teknolojileri Bilim Dalı
- Sayfa Sayısı: 77
Özet
Eşanlatım tespiti, doğal dil işleme alanında iki cümlenin aynı anlamda olup olmadığının belirlenmesi işlemidir. Makine çevirisi, otomatik metin özetleme ve intihal tespiti gibi çeşitli konulardaki uygulamalarıyla merkezi bir konudur. Son dönemde, kelime temsilleri kullanan yöntemler bu alanda başarılı sonuçlar almıştır. Kelime temsilleri, büyük derlemlerden yapay sinir ağları yöntemiyle öğrenilen yoğun vektör temsilleridir. Bu tezde; kelime temsilleri yöntemi, üzerine kısıtlı çalışma bulunan Türkçe eşanlatım tespiti problemine uygulanmıştır. Yöntemin kural tabanlı yöntemlere kıyasla katkı sağlayıp sağlamadığının sınanması hedeflenmiştir. Ana fikir, kelime temsilleri kullanılarak cümle benzerliğinin hesaplanması ve bundan yola çıkarak eşanlatım tahmini yapılmasıdır. Türkçe metinlerden yeni bir derlem hazırlanmış ve yapay sinir ağları kullanılarak kelime temsilleri öğrenilmiştir. Kelime temsillerinden cümle benzerliğini hesaplayan çeşitli yöntemler, mevcut Türkçe eşanlatım derlemleri üzerinde sınanmıştır. Daha yüksek benzerlik puanına sahip cümle çiftleri beklendiği gibi eşanlatımlı olmaya daha yatkın bulunmuştur. Sonuçlar, Türkçe eşanlatım tespiti için güncel başarım oranlarına yakındır. Özet olarak, kelime temsillerinin Türkçe eşanlatım tespiti yöntemine uygulanması yaklaşımı olumlu sonuç vermiştir. İyileştirme ve araştırma önerileri belirtilmiştir.
Özet (Çeviri)
Paraphrase identification in natural language processing is the task of deciding whether two sentences have the same meaning. It is a central topic with applications in many tasks such as machine translation, automatic text summarisation and plagiarism detection. Recent studies in this field report successful results using word embeddings, which are vector representations of words learned from large corpora using neural networks. In this thesis, we apply word embedding methods to Turkish paraphrase identification problem, which has limited research. The objective is to test if any improvement can be achieved over rule based methods. The main idea is to predict the paraphrase relation between a pair of sentences based on the similarity score calculated from word embeddings. A new corpus is created from Turkish texts and word embeddings are learned using neural networks. Several sentence similarity methods that make use of these word embeddings are evaluated against existing Turkish paraphrase corpora. Sentence pairs with a higher similarity score are found more likely to have paraphrase relation as expected. The results are close to the state-of-the-art in Turkish paraphrase identification. In summary, application of word embeddings to Turkish paraphrase identification is found a useful approach. Suggestions for improvements and further research directions are provided.
Benzer Tezler
- Paraphrase identification using knowledge-lean techniques
Başlık çevirisi yok
ASLI EYECİOĞLU ÖZMUTLU
Doktora
İngilizce
2016
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolUniversity of SussexDr. BILL KELLER
- Bir uçağın hareket denklemlerinde yer alan kararlılık türevlerinin hesaplanmasında kullanılan alternatif yöntemler
Determination of stability and control derivatives of an aircraft by using alternative methods
MURAD ÖZKIRŞEHİRLİ
Yüksek Lisans
Türkçe
2002
Uçak Mühendisliğiİstanbul Teknik ÜniversitesiUçak Mühendisliği Ana Bilim Dalı
DOÇ. DR. RAMAZAN TAŞALTIN
- Toplum sözleşmesinin felsefi kaynaklarını aramak: Thomas Hobbes, John Locke ve Jean Jacques Rousseau mukayesesi
Looking for the philosophical sources of the societh concract: The comparison of Thomas Hobbes, John Locke and Jean Jacques Rousseau's
MEHMET KUTLU
Yüksek Lisans
Türkçe
2020
Siyasal BilimlerMuş Alparslan ÜniversitesiSiyaset Bilimi ve Kamu Yönetimi Ana Bilim Dalı
DR. ÖĞR. ÜYESİ YUSUF ÇİFCİ
- Perîşannameya Mela Perîşanê Dînewerî (mein-analîz)
Molla Perişan-ı Dineverî'nin Perişannamesi (metin-analiz)
EROL ŞAYBAK
Yüksek Lisans
Kürtçe
2019
Doğu Dilleri ve EdebiyatıMardin Artuklu ÜniversitesiKürt Dili ve Kültürü Ana Bilim Dalı
DR. ÖĞR. ÜYESİ SHAHAB VALI
- Sözlü Türk musikisinde solistik icra üzerine karşılaştırmalı bir çalışma: Münir Nurettin Selçuk, Alâeddin Yavaşça ve Bekir Sıtkı Sezgin'in üslup açısından benzerlik ve farklılıkları
A comparative study about soloistic performance in Turkish classic music with lyrics: Similarities and differences between Münir Nurettin Selçuk, Alâeddin Yavaşça ve Bekir Sıtkı Sezgin as in terms of style
METİN DURGUTLU
Yüksek Lisans
Türkçe
2013
MüzikHaliç ÜniversitesiTürk Müziği Ana Sanat Dalı
YRD. DOÇ. DR. ÇETİN KÖRÜKÇÜOĞLU