Türkçe metinlerdeki anlam belirsizliği olan sözcüklerin bilgisayar algoritmaları ile anlam belirginleştirmesi
Sense disambiguation of ambiguous words in Turkish texts by machine learning algorithms
- Tez No: 178147
- Danışmanlar: DOÇ. DR. SABRİ ARIK
- Tez Türü: Doktora
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2006
- Dil: Türkçe
- Üniversite: İstanbul Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 138
Özet
Sözcük anlamı belirginlestirme, anlam belirsizliği olan sözcüğün belirli bir kullanım alanında en uygun anlamının kullanıldığı tümcedeki diğer elemanları da göz önüne alarak belirlenmesi islemidir. Bu çalısmada, Türkçe metinlerde anlam belirsizliği olan sözcüklerin anlamlarının belirginlestirilmesini sağlayacak en uygun algoritmaların ve özelliklerin belirlenmesi ele alınmıstır. Türkçe için SAB çalısmalarında kullanılabilecek sözcükler ve anlam sınıfları olusturulmus, algoritmalarda kullanılacak metinlerin elle isaretlenmesi gerçeklestirilmis ve kavramsal bir sözlük hazırlanarak bu alanda yapılacak arastırmalara önemli bir katkıda bulunulmustur. ?lk bölümlerde öncelikle doğal dil isleme çalısmaları genel olarak ele alınmıs ve buna paralel olarak Türkçe doğal dil isleme çalısmaları hakkında bilgi verilmistir. Doğal dil islemede SAB uygulama alanları, kullanılan bilgi tipleri ve kaynakları, uygulanan yöntemler ve karsılasılan problemler incelenmistir. Çalısma ile yakından iliskili olan Senseval projesinin amacı, uygulamaları ve elde edilen sonuçları ayrıntılı olarak irdelenmistir. Yapılan çalısmanın asamaları içerisinde Türkçe için derleme metin seçimi, sözcük anlamlarının olusturulması, sözcük anlamlarına etki eden özelliklerin seçimi, kullanılan yöntemler, yazılımlar ve değerlendirme kriterleri hakkında bilgi verilmistir. Son üç yıl içerisinde çalısmanın bütün asamalarında elde edilen sonuçlar grafikler ve tablolar seklinde sunulmustur. En son bölümde sonuçların ifade edildiği ve yorumlandığı, gelecekte yapılabilecek yeni çalısmalar üzerinde durulduğu genel bir değerlendirme bulunmaktadır.
Özet (Çeviri)
Word sense disambiguation is the process of selecting the most suitable sense of an ambiguous word in the given sentence by considering the other contextual features In this study, determination of the most convenient algorithms and features that may lead to the successful disambiguation of the ambiguous words in Turkish texts have been discussed. Ambiguous words and their sense classifications that can be used for Turkish word sense disambiguation studies have been established, a limited ontology has been prepared and by providing manually sense tagged corpora, an important contribution has been achieved for the researches in this domain. In the first chapters of the thesis, a brief introduction for natural language processing has been given and in parallel to this topic, important work on Turkish have been summarized. Then, the application areas of word sense disambiguation in natural language processing, knowledge types and sources, approaches in the literature and the problems of word sense disambiguation have been examined in the following sections. The objectives, applications and the results of the Senseval project, which is closely related to the thesis topic, have been exhaustively scrutinized Corpora selection, sense classification, effective features determination, tested algorithms, software and evaluation criterion that have been utilized during the phases of the study have been explained. The results obtained in the last three years from all phases of the study have been presented by graphics and tables. In the last section, a general evaluation and conclusion have been provided for commenting on the results and future work.
Benzer Tezler
- Türkçe sözcük anlam belirsizliği giderme
Word sense disambiguation for Turkish
BAHAR İLGEN
Doktora
Türkçe
2015
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. EŞREF ADALI
YRD. DOÇ. DR. AHMET CÜNEYD TANTUĞ
- Türkçe ve Almanca metinlerde çok anlamlılık: Karşılaştırmalı bir çalışma
Polysemie in Türkischen und Deutschen texten: Eine vergleichende arbeit
ESİN KARACAN
Yüksek Lisans
Almanca
2012
DilbilimGazi ÜniversitesiAlman Dili Eğitimi Ana Bilim Dalı
YRD. DOÇ. DR. N. ZEHRA BERÇİN
- Makine çevirilerinde sorun teşkil eden eş yazımlı kelimeleri bulunduran ifadeler için bir kural tabanlı çeviri modeli çalışması
A rule-based translation model for the phrases having homographs that cause difficulties in machine translation
NEVZAT ÇAPOĞLU
Doktora
Türkçe
2021
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Sabahattin Zaim ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ YAHYA ŞİRİN
- Türk dilinde zaman
Tense in Turkish
ŞEYDA ŞARKIŞLA
Doktora
Türkçe
2024
Türk Dili ve EdebiyatıSakarya ÜniversitesiTürk Dili ve Edebiyatı Ana Bilim Dalı
PROF. DR. ZİKRİ TURAN
- Metinden animasyona mekânın yeniden üretimi: Uyarlanmış mekân analizi tekniği ile bir inceleme
Reproduction of space from text to animation: An inquiry using adapted space analysis
AYLİN ÖZKAN KELEŞ
Yüksek Lisans
Türkçe
2024
MimarlıkDokuz Eylül ÜniversitesiMimarlık Ana Bilim Dalı
PROF. DR. GÖKÇEÇİÇEK SAVAŞIR