Geri Dön

Farklı dillerdeki belgelerin benzerliğinin tespiti

Diagnosis of similiarity of texts in different documents

  1. Tez No: 348472
  2. Yazar: HAKAN YILMAZER
  3. Danışmanlar: YRD. DOÇ. DR. ZEKİ YETGİN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2013
  8. Dil: Türkçe
  9. Üniversite: Mersin Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 150

Özet

Teknolojinin gelişmesi ile birlikte internet kullanımı ve web dokümanlarının boyutu paralel olarak artmaktadır. Dünyanın farklı coğrafyalarında, farklı dillerde internet ortamında dijital olarak paylaşılan dokümanlar çoğalmaktadır. İnternetin bu devasa bilgi kapasitesinde yer alan dokümanlar elbette tekil değildir. Farklı dillerdeki bu dijital dokümanların bazıları benzer içeriğe sahip olabilirken, bir kısmı diğerinin alıntısı veya özeti, bir kısmı ise orijinal dökümanın birebir çevirisi olarak yer alabilmektedir. Birçok dokümanın orijinal dilinde kopyaları, alıntıları ve benzerleri, gerek başka dillerde tercümeleri mevcuttur. Bilginin bu kadar önemli olduğu çağda, aranılan metin veya belgelerin farklı dillerdeki mevcudiyetleri bilgiye erişimi kolaylaştıracaktır. Bir dilde yazılmış belgenin başka dillerde doğru çevrimlerini ve alıntılarını hızlı bir şekilde bulmak, araştırmacılar açısından da faydalı olacaktır. Bunun yanında, aynı metnin farklı dillerde bulunabiliyor olması bir akademik çalışmanın orijinal dilinin dışındaki başka dillerdeki intihallerinin bulunmasında da yardımcı olacaktır. Bu tez çalışmasında bir belgenin farklı dillerdeki anlamsal ve içerik olarak benzerlerinin bulunması için yeni algoritmalar geliştirilmesi amaçlanmıştır. Bu algoritmalarda, dökümanlar metin, kelime, harf benzerliğinin yerine sayısal vektörler olarak düzenlenmiştir. Ayrıca uzaklık ve benzerlik ölçümleri literatürde kullanılan farklı yöntemler ile test edilmiştir.

Özet (Çeviri)

The use of internet and size of the documents have been increasing in parallel with the development of technology. The documents in different languages, which are digitally shared on Internet, have risen on different geographies of world. The documents placed in the paramount information capacity of Internet are not single for certain. While some of these digital documents in different languages have similar contents, some of them may be citation or summary of the original or some parts of the document may be literal translation of the original. The copies, citations, and duplications of the documents in original languages as well as their translations in different languages are available. The existence of the searched text or documents in various languages make easy to access the information in this era when the information is very important. It will useful for the monolingual individuals to find the translations and citations of the document which is written in mono language. Further, it will be beneficial for researchers to find a mono-lingual document?s right citiations and translations in different languages easily. Beside, the presence of a text in difference languages will be helpful for the detection of plagiarism of an academic study in different languages other from the original language of the study. In this thesis study, novel algorithms are aimed to be developed in order to find out a documents?s similarities in different languages in terms of their semantics and contents. In these algorithms, documents are organized in feature vectors rather than text, word, and letter similarities. Moreover, distance metrics and similarity measures are tested with different state of the art methods that have been used in literature.

Benzer Tezler

  1. Özbekçe ve Rusça bağlamında anlamsal ve algısal ulamlar: Özbekistan örneği

    Başlık çevirisi yok

    NADEJDA TSOY

    Yüksek Lisans

    Türkçe

    Türkçe

    2018

    DilbilimAnkara Üniversitesi

    Dilbilim Ana Bilim Dalı

    PROF. DR. SEDA GÜLSÜM GÖKMEN

  2. Derin öğrenme yöntemleri ile Türkçe el yazısı tanıma

    Turkish handwriting recognition with deep learning methods

    ALPEREN UZUN

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    Elektrik ve Elektronik MühendisliğiKaradeniz Teknik Üniversitesi

    Elektrik ve Elektronik Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ MEHMET ÖZTÜRK

  3. Çanakkale muharebelerinde 57. Alay

    The 57th Regiment in the Gallipoli campaign

    İSMAİL SABAH

    Doktora

    Türkçe

    Türkçe

    2024

    Tarihİstanbul Üniversitesi

    Tarih Ana Bilim Dalı

    PROF. DR. ALİ FUAT ÖRENÇ

  4. Milletlerarası özel hukukta iflâs

    Insolvency in private international law

    OĞUZ DORKEN

    Doktora

    Türkçe

    Türkçe

    2024

    HukukGalatasaray Üniversitesi

    Özel Hukuk Ana Bilim Dalı

    DOÇ. DR. BERK DEMİRKOL