Automated coherence detection with term-distance pat extraction of the co-occurrence matrix of a document
Bir dokümanın tekrar matrisinin kelime-mesafe yolu çıkarımı ile otomatik metin tutarlılığı tespiti
- Tez No: 409159
- Danışmanlar: YRD. DOÇ. DR. CENGİZ ACARTÜRK
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Dilbilim, Computer Engineering and Computer Science and Control, Linguistics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2015
- Dil: İngilizce
- Üniversite: Orta Doğu Teknik Üniversitesi
- Enstitü: Enformatik Enstitüsü
- Ana Bilim Dalı: Bilişsel Bilim Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 116
Özet
Bu tez, metinsel tutarlılığı ölçmek için dağılımsal anlambilimini teorik çerçeve olarak kabül etmektedir. Dağılımsal anlambilimi söylem sekmelerini vektör olarak alır ve vektör boyutlarını metindeki tekrarlı kelime sayılarından oluşturur. Bu sayede metinin anlam darağacının oluşturulmasını sağlar. Metinsel tutarlılık bu vektörlerin cosine değerleri hesaplanarak ölçülür (Gizil Anlambilim analizi, LSA). Bu çalışmalardaki ortak varsayım metin tutarlılığını ölçmek için metindeki tekrarlanan kelime frekansları bir kohezif ip ucu olarak kullanılabilir. Böylece, kelime-doküman matrisleri temelli analizlere kapı aralanmış olur. Bu tez, bir metinde ardışık cümlelerdeki tekrar eden kelimelerden elde edilen kelime-mesafe matrisinin (kelime-doküman matrisinin bir türevi) metin tutatlılığının ölç ümünde kullanılabileceğini ileri sürmektedir. Tez, do-küman-mesafe matrisinin elde edilebilmesi için 2 adet matematiksel fonksiyon ve fonksiyonları kullanan 2 adet algoritma önermektedir. Matematiksel fonksiyonlar doküman-doküman matrisinden doküman-mesafe matrisini üretmek için kullanılmaktadır. Algoritmalar, yeni önerilen doküman-mesafe matrisi uzerinde işleyerek metinsel tutarlılığı ölçmektedir.
Özet (Çeviri)
This thesis takes the distributional semantics (frequency-based semantics) approach as the theoretical framework to quantify textual coherence. Distributional semantics describes discourse sections as vectors, having dimensions are the frequency count of co-occurring words in the text within its semantic space. It quantifies the textual coherence by measuring the cosine values of vectors of successive sentences (cf. Latent Semantic Analysis, LSA). The common assumption underlying LSA based studies is that the frequency of word co-occurrence can be used as a cohesive cue to quantify textual coherence, thus leading to analyses based on a term-document matrix. In this thesis, the spatial distance of co-occurring words is considered as a new frequency event of cohesive cues and introduces a document-distance matrix, which is derived from the term-document matrix. This thesis proposes that the matrix representation of document-distance (a derivation of term-document matrix) of co-occurring words in adjacent sentences in a text can be used to quantify textual coherence. Two mathematical functions are suggested for deriving the document-distance matrix and two algorithms for the operations. The mathematical functions operate on the documentdocument matrix (a derivation of term-document matrix) to derive the documentdistance matrix. The algorithms measure the coherence of text by operating on the newly introduced document-distance matrices.
Benzer Tezler
- From place detection to long-term place memory
Yer sezimlemesinden uzun dönemli hafızalara geçiş
MAHMUT DEMİR
Yüksek Lisans
İngilizce
2016
Elektrik ve Elektronik MühendisliğiBoğaziçi ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
PROF. DR. HURİYE IŞIL BOZMA AYDIN
- Yaşa bağlı makula dejenerasyonunun optik koherens tomografi görüntüleri kullanılarak derin öğrenme yöntemleri ile tespiti
Detection of age-related macular degeneration using optical coherence tomography images via deep learning methods
NUMAN HALİT GÜLDEMİR
Yüksek Lisans
Türkçe
2022
Elektrik ve Elektronik MühendisliğiKahramanmaraş Sütçü İmam ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
PROF. DR. AHMET ALKAN
- Derin öğrenme yöntemleri ile tomografi görüntülerinden kapalı açılı glokom göz hastalığının sınıflandırılması
Classification of closed-angle glaucoma eye disease from tomography images with deep learning methods
FATİH TEKE
Yüksek Lisans
Türkçe
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSivas Cumhuriyet ÜniversitesiYapay Zeka Ana Bilim Dalı
PROF. DR. OĞUZ KAYNAR
- İdiyopatik intrakraniyal hipertansiyon olgularında optik koherens tomografi ve klinik bulgularının değerlendirilmesi
Evaluation of optical coherence tomography measurements and clinical findings in patients wi̇th idiopathic intracranial hypertension
MAHDI NAZEMIYEH
Tıpta Uzmanlık
Türkçe
2018
Göz HastalıklarıSelçuk ÜniversitesiGöz Hastalıkları Ana Bilim Dalı
PROF. DR. ŞANSAL GEDİK
- DETR derin öğrenme tekniği ile göz tomografi görüntülerinin tanımlanması
Detection of retinal OCT images using DETR deep learning technique
EFE EROĞLU
Yüksek Lisans
Türkçe
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolEskişehir Osmangazi ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. EYYÜP GÜLBANDILAR