Identifying the interactions of multi-criteria in Turkish discourse segmentation
Türkçe metin bölümlemesinde çoklu kriterlerin ilişkilerinin incelenmesi
- Tez No: 116531
- Danışmanlar: DOÇ.DR. CEM BOZŞAHİN
- Tez Türü: Doktora
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Anlamsal Bölümleme, Semantik Bilgi, Yapay Zeka, Türkçe Metin Bölümleme, Merkezleme Kuramı, Doğal Dil İşlemleme, Metin Bağlaçları. vı, Discourse Segmentation, Semantic Information, Artificial Intelligence, Turkish Discourse Segmentation, Centering Theory, Natural Language Process ing, Discourse Markers. IV
- Yıl: 2001
- Dil: İngilizce
- Üniversite: Orta Doğu Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Belirtilmemiş.
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 166
Özet
öz TÜRKÇE METİN BOLUMLENMESINDE ÇOKLU KRİTERLERİN İLİŞKİLERİNİN İNCELENMESİ Yöndem, Meltem Turhan Doktora, Bilgisayar Mühendisliği Bölülü Bölümü Tez Yöneticisi: Doç. Dr. Cem Bozşahin Ağustos 2001, 166 sayfa Bu çalışmada, metin bölümlenmesi ve Türkçe'deki uygulanması sunulmuştur. Bölümleme yapan denekler arasında istatistiksel uyumun yüksek olduğu gözlenmiştir. Türkçe metin bölümlemede etken olabilecek etmenler incelenmiş ve karar ağaçları oluşturmak için Makina Öğrenimi teknikleri kullanılmıştır. Önemli görülen özellikler şunlardır: kelimenin ilk kullanımı, fiil zaman değişimi, zaman değişimi, yer değişimi, metin bağlaçları ve işaret öbekleridir. Bunun dışında, ilgili kelimelerin aynı bölümün içerisinde beraber görünme oranı, bölümler arasında ilgili sözcüklerin görünme oranından daha yüksek olduğu gözlenmiştir. Bu özellik Otomatik TürkçeMetin Bölümlenmesinin (Automatic Turkish Discourse Segmentation - ATDS) gerçekleştirilmesinde kullanılmıştır. ATDS'nin gerçekleştirilmesinde bir de metin bağlaçları kullanılmıştır. Bu projenin önemli bir yan ürünü isimler ve fiiller için oluşturulmuş Türkçe anlam bağlantılı kelimeler ağıdır. Bu ağdaki ilişkiler: isim ler için eş anlam, zıt anlam, üstanlamlık, altanlamlık, yanaşık sözcükler; fiiller için ise eş anlam, zıt anlam, altanlamlık, yanaşık sözcükler, gerektirim ve neden olmaktır. ATDS'nin gerçekleştirimi iki aşamadan oluşmuştur:. C4.5 yardımıyla en önemli parametrelerin bulunması.. otomatik bölümleme için birinci aşamadaki en başarılı 4 parametre kombi nasyonunu kullanarak yapay ağ geliştirmek. Kendi ürünümüz İngilizce için yapılmış metin bölümleme çalışmaları ile karşılaştırıldı.
Özet (Çeviri)
ABSTRACT IDENTIFYING THE INTERACTIONS OF MULTI-CRITERIA IN TURKISH DISCOURSE SEGMENTATION Yöndem, Meltem Turhan Ph.D., Department of Computer Engineering Supervisor: Assoc. Prof. Dr. Cem Bozşahin August 2001, 166 pages In this study, a method for discourse segmentation is introduced and applied to the Turkish language domain. This method is based on the idea that new segments start when related words do not occur frequently and discourse mark ers appear at sentence initial position. A high correlation is observed by means of statistical methods among human subjects in segmenting discourse. Decision trees for various combinations of criteria have been constructed by a Machine Learning technique. The features that seem to be important are first mention of a word, tense change, time shift, location shift, discourse markers and Centering mTheory transitions. Other than these, related words are observed to appear more frequently inside a discourse segment than across a discourse segment bound ary. This feature is used in the construction of the Automatic Turkish Discourse Segmentation (ATDS) tool together with one of the most important computable features: discourse markers. An important by-product of the project is the se- mantically related Turkish word network for nouns and verbs. Relations are synonymy, hypernymy, antonymy, meronymy and coordinated words for nouns and synonymy, antonymy, hypernymy, entailment, cause and coordinated words for verbs. Implementation of ATDS consists of two phases:. gathering information about the most important parameters with the help of C4.5.. developing a Neural Network for automatic segmentation that uses the most successful 4 combinations of the first phase. We benchmark our algorithm and compare it with the English discourse segmen tation algorithms.
Benzer Tezler
- Çok katmanlı kültürel mirasın korunmasında kapasite geliştirme yaklaşımı ve katılım: Bergama (Pergamon) kenti
Capacity building and participation in the conservation of multi-layered cultural heritage: the case of Bergama (Pergamon) city
GÜLCE GÜLEYCAN OKYAY
Doktora
Türkçe
2022
MimarlıkMimar Sinan Güzel Sanatlar ÜniversitesiMimarlık Ana Bilim Dalı
PROF. DR. DEMET BİNAN
- Kentsel dinamiklerin sosyal kentsel veri aracılığı ile temsili ve kentsel tasarıma yönelik bir arayüz önerisi
Representing urban dynamics with social urban data and a interview proposal for urban design
MERAL KÖPRÜLÜ
Yüksek Lisans
Türkçe
2018
Mimarlıkİstanbul Teknik ÜniversitesiBilişim Ana Bilim Dalı
DOÇ. DR. MELTEM AKSOY
- Mekansal analiz teknikleri ile çok kriterli karar verme yaklaşımı kullanılarak raylı sistem güzergah analizi
Rail system route analysis using multi criteria decision making with spatial analysis techniques
BERNA ÇALIŞKAN
Doktora
Türkçe
2023
Ulaşımİstanbul Teknik Üniversitesiİnşaat Mühendisliği Ana Bilim Dalı
PROF. DR. ALİ OSMAN ATAHAN
- Advanced scenario planning: New approaches for developing, evaluating, and selecting scenarios with applications
İleri senaryo planlama: Senaryoların geliştirilmesi, değerlendirilmesi ve seçilmesi için yeni yaklaşımlar ve uygulamaları
ÖZGÜR YANMAZ
Doktora
İngilizce
2024
Endüstri ve Endüstri Mühendisliğiİstanbul Teknik ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
DOÇ. DR. UMUT ASAN
- Human centred performance approach (hcpa) for adaptive facade design
Uyum gösteren cephe tasarımı için insan odaklı performans yaklaşımı
MİNE KOYAZ
Doktora
İngilizce
2022
Mimarlıkİstanbul Teknik ÜniversitesiMimarlık Ana Bilim Dalı
PROF. DR. GÜLTEN ASLIHAN ÜNLÜ