Geri Dön

Paraphrase identification in turkish using distributed representations of words and sentences

Dağıtık kelime ve cümle temsilleri kullanılarak türkçe eşanlatım tespiti

  1. Tez No: 611140
  2. Yazar: HAKKI ENGİN YORGANCIOĞLU
  3. Danışmanlar: PROF. DR. BAHAR KARAOĞLAN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2019
  8. Dil: İngilizce
  9. Üniversite: Ege Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Uluslararası Bilgisayar Ana Bilim Dalı
  12. Bilim Dalı: Bilgi Teknolojileri Bilim Dalı
  13. Sayfa Sayısı: 77

Özet

Eşanlatım tespiti, doğal dil işleme alanında iki cümlenin aynı anlamda olup olmadığının belirlenmesi işlemidir. Makine çevirisi, otomatik metin özetleme ve intihal tespiti gibi çeşitli konulardaki uygulamalarıyla merkezi bir konudur. Son dönemde, kelime temsilleri kullanan yöntemler bu alanda başarılı sonuçlar almıştır. Kelime temsilleri, büyük derlemlerden yapay sinir ağları yöntemiyle öğrenilen yoğun vektör temsilleridir. Bu tezde; kelime temsilleri yöntemi, üzerine kısıtlı çalışma bulunan Türkçe eşanlatım tespiti problemine uygulanmıştır. Yöntemin kural tabanlı yöntemlere kıyasla katkı sağlayıp sağlamadığının sınanması hedeflenmiştir. Ana fikir, kelime temsilleri kullanılarak cümle benzerliğinin hesaplanması ve bundan yola çıkarak eşanlatım tahmini yapılmasıdır. Türkçe metinlerden yeni bir derlem hazırlanmış ve yapay sinir ağları kullanılarak kelime temsilleri öğrenilmiştir. Kelime temsillerinden cümle benzerliğini hesaplayan çeşitli yöntemler, mevcut Türkçe eşanlatım derlemleri üzerinde sınanmıştır. Daha yüksek benzerlik puanına sahip cümle çiftleri beklendiği gibi eşanlatımlı olmaya daha yatkın bulunmuştur. Sonuçlar, Türkçe eşanlatım tespiti için güncel başarım oranlarına yakındır. Özet olarak, kelime temsillerinin Türkçe eşanlatım tespiti yöntemine uygulanması yaklaşımı olumlu sonuç vermiştir. İyileştirme ve araştırma önerileri belirtilmiştir.

Özet (Çeviri)

Paraphrase identification in natural language processing is the task of deciding whether two sentences have the same meaning. It is a central topic with applications in many tasks such as machine translation, automatic text summarisation and plagiarism detection. Recent studies in this field report successful results using word embeddings, which are vector representations of words learned from large corpora using neural networks. In this thesis, we apply word embedding methods to Turkish paraphrase identification problem, which has limited research. The objective is to test if any improvement can be achieved over rule based methods. The main idea is to predict the paraphrase relation between a pair of sentences based on the similarity score calculated from word embeddings. A new corpus is created from Turkish texts and word embeddings are learned using neural networks. Several sentence similarity methods that make use of these word embeddings are evaluated against existing Turkish paraphrase corpora. Sentence pairs with a higher similarity score are found more likely to have paraphrase relation as expected. The results are close to the state-of-the-art in Turkish paraphrase identification. In summary, application of word embeddings to Turkish paraphrase identification is found a useful approach. Suggestions for improvements and further research directions are provided.

Benzer Tezler

  1. Bir uçağın hareket denklemlerinde yer alan kararlılık türevlerinin hesaplanmasında kullanılan alternatif yöntemler

    Determination of stability and control derivatives of an aircraft by using alternative methods

    MURAD ÖZKIRŞEHİRLİ

    Yüksek Lisans

    Türkçe

    Türkçe

    2002

    Uçak Mühendisliğiİstanbul Teknik Üniversitesi

    Uçak Mühendisliği Ana Bilim Dalı

    DOÇ. DR. RAMAZAN TAŞALTIN

  2. Toplum sözleşmesinin felsefi kaynaklarını aramak: Thomas Hobbes, John Locke ve Jean Jacques Rousseau mukayesesi

    Looking for the philosophical sources of the societh concract: The comparison of Thomas Hobbes, John Locke and Jean Jacques Rousseau's

    MEHMET KUTLU

    Yüksek Lisans

    Türkçe

    Türkçe

    2020

    Siyasal BilimlerMuş Alparslan Üniversitesi

    Siyaset Bilimi ve Kamu Yönetimi Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ YUSUF ÇİFCİ

  3. Perîşannameya Mela Perîşanê Dînewerî (mein-analîz)

    Molla Perişan-ı Dineverî'nin Perişannamesi (metin-analiz)

    EROL ŞAYBAK

    Yüksek Lisans

    Kürtçe

    Kürtçe

    2019

    Doğu Dilleri ve EdebiyatıMardin Artuklu Üniversitesi

    Kürt Dili ve Kültürü Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ SHAHAB VALI

  4. Sözlü Türk musikisinde solistik icra üzerine karşılaştırmalı bir çalışma: Münir Nurettin Selçuk, Alâeddin Yavaşça ve Bekir Sıtkı Sezgin'in üslup açısından benzerlik ve farklılıkları

    A comparative study about soloistic performance in Turkish classic music with lyrics: Similarities and differences between Münir Nurettin Selçuk, Alâeddin Yavaşça ve Bekir Sıtkı Sezgin as in terms of style

    METİN DURGUTLU

    Yüksek Lisans

    Türkçe

    Türkçe

    2013

    MüzikHaliç Üniversitesi

    Türk Müziği Ana Sanat Dalı

    YRD. DOÇ. DR. ÇETİN KÖRÜKÇÜOĞLU