Geri Dön

Automated coherence detection with term-distance pat extraction of the co-occurrence matrix of a document

Bir dokümanın tekrar matrisinin kelime-mesafe yolu çıkarımı ile otomatik metin tutarlılığı tespiti

  1. Tez No: 409159
  2. Yazar: HALİL AĞIN
  3. Danışmanlar: YRD. DOÇ. DR. CENGİZ ACARTÜRK
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Dilbilim, Computer Engineering and Computer Science and Control, Linguistics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2015
  8. Dil: İngilizce
  9. Üniversite: Orta Doğu Teknik Üniversitesi
  10. Enstitü: Enformatik Enstitüsü
  11. Ana Bilim Dalı: Bilişsel Bilim Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 116

Özet

Bu tez, metinsel tutarlılığı ölçmek için dağılımsal anlambilimini teorik çerçeve olarak kabül etmektedir. Dağılımsal anlambilimi söylem sekmelerini vektör olarak alır ve vektör boyutlarını metindeki tekrarlı kelime sayılarından oluşturur. Bu sayede metinin anlam darağacının oluşturulmasını sağlar. Metinsel tutarlılık bu vektörlerin cosine değerleri hesaplanarak ölçülür (Gizil Anlambilim analizi, LSA). Bu çalışmalardaki ortak varsayım metin tutarlılığını ölçmek için metindeki tekrarlanan kelime frekansları bir kohezif ip ucu olarak kullanılabilir. Böylece, kelime-doküman matrisleri temelli analizlere kapı aralanmış olur. Bu tez, bir metinde ardışık cümlelerdeki tekrar eden kelimelerden elde edilen kelime-mesafe matrisinin (kelime-doküman matrisinin bir türevi) metin tutatlılığının ölç ümünde kullanılabileceğini ileri sürmektedir. Tez, do-küman-mesafe matrisinin elde edilebilmesi için 2 adet matematiksel fonksiyon ve fonksiyonları kullanan 2 adet algoritma önermektedir. Matematiksel fonksiyonlar doküman-doküman matrisinden doküman-mesafe matrisini üretmek için kullanılmaktadır. Algoritmalar, yeni önerilen doküman-mesafe matrisi uzerinde işleyerek metinsel tutarlılığı ölçmektedir.

Özet (Çeviri)

This thesis takes the distributional semantics (frequency-based semantics) approach as the theoretical framework to quantify textual coherence. Distributional semantics describes discourse sections as vectors, having dimensions are the frequency count of co-occurring words in the text within its semantic space. It quantifies the textual coherence by measuring the cosine values of vectors of successive sentences (cf. Latent Semantic Analysis, LSA). The common assumption underlying LSA based studies is that the frequency of word co-occurrence can be used as a cohesive cue to quantify textual coherence, thus leading to analyses based on a term-document matrix. In this thesis, the spatial distance of co-occurring words is considered as a new frequency event of cohesive cues and introduces a document-distance matrix, which is derived from the term-document matrix. This thesis proposes that the matrix representation of document-distance (a derivation of term-document matrix) of co-occurring words in adjacent sentences in a text can be used to quantify textual coherence. Two mathematical functions are suggested for deriving the document-distance matrix and two algorithms for the operations. The mathematical functions operate on the documentdocument matrix (a derivation of term-document matrix) to derive the documentdistance matrix. The algorithms measure the coherence of text by operating on the newly introduced document-distance matrices.

Benzer Tezler

  1. From place detection to long-term place memory

    Yer sezimlemesinden uzun dönemli hafızalara geçiş

    MAHMUT DEMİR

    Yüksek Lisans

    İngilizce

    İngilizce

    2016

    Elektrik ve Elektronik MühendisliğiBoğaziçi Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    PROF. DR. HURİYE IŞIL BOZMA AYDIN

  2. Yaşa bağlı makula dejenerasyonunun optik koherens tomografi görüntüleri kullanılarak derin öğrenme yöntemleri ile tespiti

    Detection of age-related macular degeneration using optical coherence tomography images via deep learning methods

    NUMAN HALİT GÜLDEMİR

    Yüksek Lisans

    Türkçe

    Türkçe

    2022

    Elektrik ve Elektronik MühendisliğiKahramanmaraş Sütçü İmam Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    PROF. DR. AHMET ALKAN

  3. Derin öğrenme yöntemleri ile tomografi görüntülerinden kapalı açılı glokom göz hastalığının sınıflandırılması

    Classification of closed-angle glaucoma eye disease from tomography images with deep learning methods

    FATİH TEKE

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSivas Cumhuriyet Üniversitesi

    Yapay Zeka Ana Bilim Dalı

    PROF. DR. OĞUZ KAYNAR

  4. İdiyopatik intrakraniyal hipertansiyon olgularında optik koherens tomografi ve klinik bulgularının değerlendirilmesi

    Evaluation of optical coherence tomography measurements and clinical findings in patients wi̇th idiopathic intracranial hypertension

    MAHDI NAZEMIYEH

    Tıpta Uzmanlık

    Türkçe

    Türkçe

    2018

    Göz HastalıklarıSelçuk Üniversitesi

    Göz Hastalıkları Ana Bilim Dalı

    PROF. DR. ŞANSAL GEDİK

  5. DETR derin öğrenme tekniği ile göz tomografi görüntülerinin tanımlanması

    Detection of retinal OCT images using DETR deep learning technique

    EFE EROĞLU

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolEskişehir Osmangazi Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. EYYÜP GÜLBANDILAR