A linguistically motivated information retrieval system for Turkish
Türkçe için geliştirilmiş dilbilime dayalı bir bilgiye erişim sistemi
- Tez No: 152514
- Danışmanlar: PROF.DR. CEM SAY
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2004
- Dil: İngilizce
- Üniversite: Boğaziçi Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 79
Özet
Ağdaki belgelerdeki büyük artış ve İnternet'in yaygın kullanımı nedeniyle, bilgiye erişim günümüzün bilgisayar dünyasında önemli bir uygulama haline gelmiştir. Ancak, klasik“kelime torbası”yaklaşımı, kullanıcı beklentilerim artık yeterince karşılayamamaktadır. Bu bağlamda, doğal dil işleme (DDİ) tekniklerinin kullanımı akla gelmektedir. Bu tezde, doğal dil işleme tekniklerinin Türkçe'de bilgiye erişim etkinliğini geliştirip geliştiremeyeceği sorununu ele almaktayız. TURNA adında, dilbilime dayalı bir bilgiye erişim sistemi gerçekleştirdik. Sistem, doküman ve bilgi isteklerini işlemede doğal dil işlemenin üç değişik düzeyindeki bilgileri kullanmaktadır: biçimbilim, sözdizim ve kavramsal sözlük düzeyleri. Bu doğal dil işleme tekniklerinin değişik birleşimleri Türkçe belgeler ve bilgi isteklerinden oluşan bir küme üzerinde sınanmıştır. Sonuçlar, kesinlik ve geriçağırım açısından ele alınmıştır. Doğal dil işleme tekniklerinin, özellikle gövdeleme ve sözdizimsel tamlayan-tamlanan ikililerinin kullanımımn, Türkçe bilgiye erişim etkinliğini geliştirebildiği ortaya çıkarılmıştır.
Özet (Çeviri)
Information retrieval (IR) has become an important application in today's computer world because of the great increase in the amount of web-based documents and the widespread use of the Internet. However, the classical“bag of words”approach no longer meets user expectations adequately. In this context, the use of natural language processing (NLP) techniques comes into mind. In this thesis, we investigate the question of whether NLP techniques can improve the effectiveness of information retrieval in Turkish. We implemented a linguistically motivated information retrieval system, called TURNA (TUrkish information Retrieval engine based on Natural language Analysis). The system uses knowledge of three different levels of natural language processing in document and query processing: morphological, syntactical and lexico-semantical levels. Different combinations of these NLP techniques are tested on a set of Turkish documents and queries. The results are evaluated in terms of precision and recall. It is shown that natural language processing techniques, especially stemming and the use of syntactical head-modifier pairs, can improve information retrieval effectiveness in Turkish.
Benzer Tezler
- Building of Turkish propbank and semantic role labeling of Turkish
Türkçe önerme veri tabanının oluşturulması ve Türkçenin anlamsal görev çözümlemesi
GÖZDE GÜL ŞAHİN
Doktora
İngilizce
2018
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. EŞREF ADALI
- Natural language processing for mining neuroanatomical relations among brain regions
Doğal dil işleme kullanılarak beyin bölümleri arasındaki ilişkiler için metin madenciliği
ERİNÇ GÖKDENİZ
Yüksek Lisans
İngilizce
2016
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. ARZUCAN ÖZGÜR TÜRKMEN
PROF. DR. REŞİT ŞAHİN CANBEYLİ
- Using multiple sources of information for constraint-based morphological disambiquation
Değişik bilgi kaynakları kullanarak biçimbirimsel birikleştirme
GÖKHAN TÜR
Yüksek Lisans
İngilizce
1996
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİhsan Doğramacı Bilkent ÜniversitesiY.DOÇ.DR. KEMAL OFLAZER
- Morphologically motivated ınput variations in Turkish-English neural machine translation
Türkçe-İngilizce sinirsel makine çevirisinde morfolojik güdümlü girdi varyasyonları
ZEYNEP YİRMİBEŞOĞLU
Yüksek Lisans
İngilizce
2021
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. TUNGA GÜNGÖR
- Statistical and discriminative language modeling for Turkish large vocabulary continuous speech recognition
Türkçe geniş dağarcıklı konuşma tanıma için istatistiksel ve ayırıcı dil modellemesi
EBRU ARISOY
Doktora
İngilizce
2009
Elektrik ve Elektronik MühendisliğiBoğaziçi ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. MURAT SARAÇLAR