Geri Dön

A linguistically motivated information retrieval system for Turkish

Türkçe için geliştirilmiş dilbilime dayalı bir bilgiye erişim sistemi

  1. Tez No: 152514
  2. Yazar: FATMA CANAN PEMBE
  3. Danışmanlar: PROF.DR. CEM SAY
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2004
  8. Dil: İngilizce
  9. Üniversite: Boğaziçi Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 79

Özet

Ağdaki belgelerdeki büyük artış ve İnternet'in yaygın kullanımı nedeniyle, bilgiye erişim günümüzün bilgisayar dünyasında önemli bir uygulama haline gelmiştir. Ancak, klasik“kelime torbası”yaklaşımı, kullanıcı beklentilerim artık yeterince karşılayamamaktadır. Bu bağlamda, doğal dil işleme (DDİ) tekniklerinin kullanımı akla gelmektedir. Bu tezde, doğal dil işleme tekniklerinin Türkçe'de bilgiye erişim etkinliğini geliştirip geliştiremeyeceği sorununu ele almaktayız. TURNA adında, dilbilime dayalı bir bilgiye erişim sistemi gerçekleştirdik. Sistem, doküman ve bilgi isteklerini işlemede doğal dil işlemenin üç değişik düzeyindeki bilgileri kullanmaktadır: biçimbilim, sözdizim ve kavramsal sözlük düzeyleri. Bu doğal dil işleme tekniklerinin değişik birleşimleri Türkçe belgeler ve bilgi isteklerinden oluşan bir küme üzerinde sınanmıştır. Sonuçlar, kesinlik ve geriçağırım açısından ele alınmıştır. Doğal dil işleme tekniklerinin, özellikle gövdeleme ve sözdizimsel tamlayan-tamlanan ikililerinin kullanımımn, Türkçe bilgiye erişim etkinliğini geliştirebildiği ortaya çıkarılmıştır.

Özet (Çeviri)

Information retrieval (IR) has become an important application in today's computer world because of the great increase in the amount of web-based documents and the widespread use of the Internet. However, the classical“bag of words”approach no longer meets user expectations adequately. In this context, the use of natural language processing (NLP) techniques comes into mind. In this thesis, we investigate the question of whether NLP techniques can improve the effectiveness of information retrieval in Turkish. We implemented a linguistically motivated information retrieval system, called TURNA (TUrkish information Retrieval engine based on Natural language Analysis). The system uses knowledge of three different levels of natural language processing in document and query processing: morphological, syntactical and lexico-semantical levels. Different combinations of these NLP techniques are tested on a set of Turkish documents and queries. The results are evaluated in terms of precision and recall. It is shown that natural language processing techniques, especially stemming and the use of syntactical head-modifier pairs, can improve information retrieval effectiveness in Turkish.

Benzer Tezler

  1. Building of Turkish propbank and semantic role labeling of Turkish

    Türkçe önerme veri tabanının oluşturulması ve Türkçenin anlamsal görev çözümlemesi

    GÖZDE GÜL ŞAHİN

    Doktora

    İngilizce

    İngilizce

    2018

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. EŞREF ADALI

  2. Natural language processing for mining neuroanatomical relations among brain regions

    Doğal dil işleme kullanılarak beyin bölümleri arasındaki ilişkiler için metin madenciliği

    ERİNÇ GÖKDENİZ

    Yüksek Lisans

    İngilizce

    İngilizce

    2016

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. ARZUCAN ÖZGÜR TÜRKMEN

    PROF. DR. REŞİT ŞAHİN CANBEYLİ

  3. Using multiple sources of information for constraint-based morphological disambiquation

    Değişik bilgi kaynakları kullanarak biçimbirimsel birikleştirme

    GÖKHAN TÜR

  4. Morphologically motivated ınput variations in Turkish-English neural machine translation

    Türkçe-İngilizce sinirsel makine çevirisinde morfolojik güdümlü girdi varyasyonları

    ZEYNEP YİRMİBEŞOĞLU

    Yüksek Lisans

    İngilizce

    İngilizce

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. TUNGA GÜNGÖR

  5. Statistical and discriminative language modeling for Turkish large vocabulary continuous speech recognition

    Türkçe geniş dağarcıklı konuşma tanıma için istatistiksel ve ayırıcı dil modellemesi

    EBRU ARISOY

    Doktora

    İngilizce

    İngilizce

    2009

    Elektrik ve Elektronik MühendisliğiBoğaziçi Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. MURAT SARAÇLAR