Türkçe derlemlerdeki artgönderimlerin tümdengelimli ve tümevarımlı yöntemlerle çözümlenmesi
Resolving anaphora in Turkish text using inductive and deductive methods
- Tez No: 177358
- Danışmanlar: YRD. DOÇ. DR. YILMAZ KILIÇASLAN
- Tez Türü: Doktora
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Bilim ve Teknoloji, Computer Engineering and Computer Science and Control, Science and Technology
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2008
- Dil: Türkçe
- Üniversite: Trakya Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Bölümü
- Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Sayfa Sayısı: 122
Özet
Bu tez çalışmasında Türkçe Artgönderim Problemi çeşitli yaklaşımlar ışığında ele alınmıştır. Bilgi tabanlı tümdengelimli yöntemlerle, öğrenme tabanlı tümevarımlı yöntemler birbirleriyle çeşitli açılardan karşılaştırılmıştır. Belirginlik Tabanlı yaklaşım ile Merkezleme Algoritması, bilgi tabanlı yöntemleri değerlendirmek için ele alınmıştır. Makine Öğrenme algoritmalarından karar ağaçları, na\"ive Bayes algoritması, k-en yakın komşu algoritması, Destek Vektör makineleri ve algılayıcılar artgönderim problemine uygulanmıştır. Bazı Türkçe metinlerdeki artgönderimsel ilişkiler bilgisayarlı bu modellerle az bilgi kullanılarak çözümlenmiş ve deney sonuçlarına dayanarak birçok bulgu sunulmuştur. Bu alanda Türkçe için yapılan çalışmaların azlığı sebebiyle araştırmacılar tarafından kullanılan ortak bir derlem bulunamamıştır. Bu nedenle 10000 kelime kapasiteli 1114 adıl içeren bir derlem yaratılmıştır. Çeşitli deneylerle bu derlem üzerindeki gönderimsel ilişkilerin davranışı analiz edilmiştir. Deney sonuçlarını değerlendirebilmek için derlemdeki gönderimsel ilişkiler elle işaretlenmiştir. Kapsam olarak adılsal artgönderim, dönüşlü artgönderim, boş artgönderim ve karşlılıklı artgönderim tipleri ele alınmıştır. Bu tezin temel amacı Türkçe \textbf{Artgönderim Çözümlemesi} için az bilgili ve bilgisayarlı yaklaşımlar sunmak, bu yaklaşımları birbirleriyle kıyaslamak ve bu problemin bilgisayarlı çözümlenmesi için bir tartışma başlatmaktır.
Özet (Çeviri)
In this study, the problem of anaphora resolution in Turkish is addressed in the light of various approaches. Knowledge-based deductive methods and learning-based inductive methods are compared from various points of view. The salience-based approach and the centering algorithm are chosen as examples of knowledge-based methods to evaluate. Of machines learning algorithms, decision trees, the na\"ive Bayes algorithm, the k-nearest neighbor classifier, support vector machines, and the voted perceptron are chosen and applied to the problem of anaphora resolution. Anaphoric relations in some Turkish texts are resolved by means of these computational techniques in a knowledge-poor framework and numerous findings are presented as results of the experiments.Since there is no publicly released corpus on which we can conduct our experiment, we needed to create a Turkish corpus- with the capacity of 10000 tokens and of 1114 pronouns- in which anaphoric relations are mannually annotated. Pronominal anaphora, reflexive anaphora, null pronoun, and reciprocals are in the scope of this study. So, main goal of the study is to provide a computational resolution for the turkish language, to compare deductive and inductive approaches, and to start a discussion about the problem.
Benzer Tezler
- Türkçe derlemler için sözdizimsel görselleştirme ve sorgulama aracı
Syntactic visualization and query tool for Turkish corpora
CEM AGAN
Yüksek Lisans
Türkçe
2016
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolYıldız Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. BANU DİRİ
- Türkçe öğrenici derlemi (TÖD): sözcük sıklığı ve yanlış çözümlemesi
Turkish learner corpus (TLC): Word frequency and error analysis
DEREM ÇANGA
- Yabancılara Türkçe öğretiminde mühendislik alanı ile ilgili akademik söz varlığı
Academic vocabulary in the field of engineering in teaching Turkish as a foreign language
NAZİK MÜGE TEKİN
Doktora
Türkçe
2024
Eğitim ve ÖğretimHacettepe ÜniversitesiTürkiyat Araştırmaları Ana Bilim Dalı
PROF. DR. NURETTİN DEMİR
- Türkçe sözcük anlam belirsizliği giderme
Word sense disambiguation for Turkish
BAHAR İLGEN
Doktora
Türkçe
2015
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. EŞREF ADALI
YRD. DOÇ. DR. AHMET CÜNEYD TANTUĞ
- Aşık Hasan Hüseyin Orhan'ın hayatı ve eserlerinin belgelerle tesbiti
Başlık çevirisi yok
MUHARREM NACİ TEMİZ
Yüksek Lisans
Türkçe
1999
Müzikİstanbul Teknik ÜniversitesiTemel Bilimler Ana Sanat Dalı
DOÇ. DR. CAN ETİLİ ÖKTEN