Geri Dön

Smart Bilgi Erişim Sistemi'nin Türkçe yerelleştirilmesi ve otomatik gömü üretimi

Turkish localization of Smart Information Retrieval System and automatic thesaurus construction

  1. Tez No: 84237
  2. Yazar: EBRU SEZER
  3. Danışmanlar: DOÇ. DR. HAYRİ SEVER
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 1999
  8. Dil: Türkçe
  9. Üniversite: Hacettepe Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Bilimleri Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 135

Özet

IV ÖZET Bilgi erişim sistemleri, doğal dilde yazılmış metinlerin elektronik ortamda saklanmasını ve bilgi bulma, toplama, araştırma gibi farklı amaçlarla erişimini sağlayan sistemlerdir. 1960'lı yıllara gelirken günümüzdeki anlamıyla kullanılmaya başlayan bilgi erişim sistemleri, bilgisayar bilimleri ve teknolojisindeki gelişmelere paralel bir gelişim süreci göstermiştir. Türkiye'de ise 1973'lerde başlayan çalışmalar, varolan gelişimleri takip etmede süreklilik göstermemiştir. Oysa ki bilgi erişim sistemleri girdi olarak doğal dilde hazırlanmış metinleri işlerler. Daha etkin bir erişim çıktısı üretmek için terimleri gövdeleyerek ve gömü aracılığı ile kullandıklarından ilgili doğal dile bağımlıdırlar Dolayısıyla bu alanda geliştirilen yöntemlerin, uygulamaların Türkçe dilbilgisi açısından yeniden gözden geçirilmesi gereklidir. Bu bariz ihtiyaçtan hareketle Hacettepe Üniversitesi bünyesinde, Devlet Planlama Teşkilatı (DPT) tarafından desteklenen“Kaşgarlı Mahmut Bilgi Geri Getirim Sistemi (KM-BGS)”(Proje No. 97K121330) adlı proje başlatılmıştır. Tez kapsamında, KM- BGS'nin bilgi erişim sistemi modülüne temel olması amacıyla SMART Bilgi Erişim Sistemi'nin Türkçe yerelleştirilmesi yapılmıştır. Buna ilaveten, bir belge derlemi için sözcükler arası ilişkileri kuran otomatik gömü gerçekleştirilmiştir. SMART Bilgi Erişim Sistemi'ne eklenen Türkçe gövdeleme algoritması ve gömü kullanıldığında elde edilen erişim performansı değişimlerinin araştırıldığı bir dizi deney tanımlanmış ve gerçekleştirilmiştir.. Elde edilen sonuçlar şöyle özetlenebilir; (a) sözcükleri dizinlemede gövdeler halinde kullanmak erişim performasını artırmıştır, (b) gömü kullanımı, salt gövdeleme yapılarak elde edilen sonuçlar ile karşılaştırıldığında performansı artırmamıştır. Ancak sorgu için üretilen erişim çıktısında, ilgili belgeleri ilgisiz belgelerin üstüne yerleştirmiştir. ANAHTAR KELİMELER: Gövdeleme algoritmaları, vektör uzayı modeli, gömü, kümeleme.

Özet (Çeviri)

ABSTRACT Information Retrieval Systems (IRSs) provides facilities to store and retrieve electronic documents in different contexts of information needs like seeking, gathering, and collection. Since I960' s the developments in the notion of contemporary IRSs have demonstrated the similar progress in parallel with that in computer science and technology. The studies in this area in Turkey have begun in 1973, but have not shown continuity up to now. IRSs process documents in their native languages in order to provide stemming and thesaurus of words for quality concern of retrieval output and hence, they depend on corresponding natural language. Consequently, applications and methods that are available for use in this area need be re-examined in respect to grammar of Turkish. To meet this obvious necessity, the project, which is called“Kaşgarlı Mahmut Bilgi Geri-Getirim Sistemi (KM-BGS)”and has been supported by State Planning Organization (Project No. 97K121330), has been launched at Hacettepe University. In the scope of this thesis, Turkish localization of SMART Information Retrieval System was done and became basis for information retrieval module of KM-BGS. In addition, the automatic thesaurus that constructs the relationships of terms for given a document collection was implemented. To investigate performance issues in regard to use of Turkish stemming algorithm with and without thesaurus, the experimental study has been defined and proceeded. The results of experiments can be summarized as follows: (a) using stemmed terms at indexing stage increases retrieval performance, (b) using thesaurus along with stemming utility doesn't increase retrieval performance, when compared with the case where only stemming algorithm for indexing is employed, but it ranks related documents ahead of unrelated ones in the retrieval output for a given query. KEY WORDS: stemming algorithms, vector space model, thesaurus, clustering.

Benzer Tezler

  1. Gövdelemenin ve gömünün türkçe bir bilgi erişim sistemi üzerindeki etkisinin araştırılması

    A Study on the effects of stemming and thesaurus for retrieving information in Turkish documents

    MEHMET EROĞLU

    Yüksek Lisans

    Türkçe

    Türkçe

    2000

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHacettepe Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. HAYRİ SEVER

  2. Avrupa'daki depozito yönetim sistemi uygulamalarının incelenmesi ve zorunlu depozito yönetim sisteminin Türkiye'de uygulanmasına yönelik öneriler

    Examination of deposit management system applications in Europe and suggestions for the implementation of mandatory deposit management system in Türkiye

    AYBİKE MISIR

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    Çevre Mühendisliğiİstanbul Teknik Üniversitesi

    Çevre Mühendisliği Ana Bilim Dalı

    PROF. DR. OSMAN ATİLLA ARIKAN

  3. Ortam tabanlı modülasyonlu işbirlikli dik olmayan çoklu erişim

    Media-based modulated cooperative non-orthogonal multiple access

    MEHMET CAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    PROF. DR. İBRAHİM ALTUNBAŞ

  4. İstemci/sunucu mimarisinde veritabanı uygulamaları

    Database applications with client/server architecture

    SERKAN YENİDOĞAN

    Yüksek Lisans

    Türkçe

    Türkçe

    1999

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Üniversitesi

    Bilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. ZEYNEP ALTAN

  5. Yüz veritabanı uygulaması yapılandırması ve yüz özniteliklerinde öğrenme yöntemlerinin veritabanına uygulanması

    Face database application implementation and applying learning methods on face features to database

    GİZEM İREM KOZAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2014

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    PROF. TAYFUN AKGÜL