Smart Bilgi Erişim Sistemi'nin Türkçe yerelleştirilmesi ve otomatik gömü üretimi
Turkish localization of Smart Information Retrieval System and automatic thesaurus construction
- Tez No: 84237
- Danışmanlar: DOÇ. DR. HAYRİ SEVER
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 1999
- Dil: Türkçe
- Üniversite: Hacettepe Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Bilimleri Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 135
Özet
IV ÖZET Bilgi erişim sistemleri, doğal dilde yazılmış metinlerin elektronik ortamda saklanmasını ve bilgi bulma, toplama, araştırma gibi farklı amaçlarla erişimini sağlayan sistemlerdir. 1960'lı yıllara gelirken günümüzdeki anlamıyla kullanılmaya başlayan bilgi erişim sistemleri, bilgisayar bilimleri ve teknolojisindeki gelişmelere paralel bir gelişim süreci göstermiştir. Türkiye'de ise 1973'lerde başlayan çalışmalar, varolan gelişimleri takip etmede süreklilik göstermemiştir. Oysa ki bilgi erişim sistemleri girdi olarak doğal dilde hazırlanmış metinleri işlerler. Daha etkin bir erişim çıktısı üretmek için terimleri gövdeleyerek ve gömü aracılığı ile kullandıklarından ilgili doğal dile bağımlıdırlar Dolayısıyla bu alanda geliştirilen yöntemlerin, uygulamaların Türkçe dilbilgisi açısından yeniden gözden geçirilmesi gereklidir. Bu bariz ihtiyaçtan hareketle Hacettepe Üniversitesi bünyesinde, Devlet Planlama Teşkilatı (DPT) tarafından desteklenen“Kaşgarlı Mahmut Bilgi Geri Getirim Sistemi (KM-BGS)”(Proje No. 97K121330) adlı proje başlatılmıştır. Tez kapsamında, KM- BGS'nin bilgi erişim sistemi modülüne temel olması amacıyla SMART Bilgi Erişim Sistemi'nin Türkçe yerelleştirilmesi yapılmıştır. Buna ilaveten, bir belge derlemi için sözcükler arası ilişkileri kuran otomatik gömü gerçekleştirilmiştir. SMART Bilgi Erişim Sistemi'ne eklenen Türkçe gövdeleme algoritması ve gömü kullanıldığında elde edilen erişim performansı değişimlerinin araştırıldığı bir dizi deney tanımlanmış ve gerçekleştirilmiştir.. Elde edilen sonuçlar şöyle özetlenebilir; (a) sözcükleri dizinlemede gövdeler halinde kullanmak erişim performasını artırmıştır, (b) gömü kullanımı, salt gövdeleme yapılarak elde edilen sonuçlar ile karşılaştırıldığında performansı artırmamıştır. Ancak sorgu için üretilen erişim çıktısında, ilgili belgeleri ilgisiz belgelerin üstüne yerleştirmiştir. ANAHTAR KELİMELER: Gövdeleme algoritmaları, vektör uzayı modeli, gömü, kümeleme.
Özet (Çeviri)
ABSTRACT Information Retrieval Systems (IRSs) provides facilities to store and retrieve electronic documents in different contexts of information needs like seeking, gathering, and collection. Since I960' s the developments in the notion of contemporary IRSs have demonstrated the similar progress in parallel with that in computer science and technology. The studies in this area in Turkey have begun in 1973, but have not shown continuity up to now. IRSs process documents in their native languages in order to provide stemming and thesaurus of words for quality concern of retrieval output and hence, they depend on corresponding natural language. Consequently, applications and methods that are available for use in this area need be re-examined in respect to grammar of Turkish. To meet this obvious necessity, the project, which is called“Kaşgarlı Mahmut Bilgi Geri-Getirim Sistemi (KM-BGS)”and has been supported by State Planning Organization (Project No. 97K121330), has been launched at Hacettepe University. In the scope of this thesis, Turkish localization of SMART Information Retrieval System was done and became basis for information retrieval module of KM-BGS. In addition, the automatic thesaurus that constructs the relationships of terms for given a document collection was implemented. To investigate performance issues in regard to use of Turkish stemming algorithm with and without thesaurus, the experimental study has been defined and proceeded. The results of experiments can be summarized as follows: (a) using stemmed terms at indexing stage increases retrieval performance, (b) using thesaurus along with stemming utility doesn't increase retrieval performance, when compared with the case where only stemming algorithm for indexing is employed, but it ranks related documents ahead of unrelated ones in the retrieval output for a given query. KEY WORDS: stemming algorithms, vector space model, thesaurus, clustering.
Benzer Tezler
- Gövdelemenin ve gömünün türkçe bir bilgi erişim sistemi üzerindeki etkisinin araştırılması
A Study on the effects of stemming and thesaurus for retrieving information in Turkish documents
MEHMET EROĞLU
Yüksek Lisans
Türkçe
2000
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHacettepe ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. HAYRİ SEVER
- Avrupa'daki depozito yönetim sistemi uygulamalarının incelenmesi ve zorunlu depozito yönetim sisteminin Türkiye'de uygulanmasına yönelik öneriler
Examination of deposit management system applications in Europe and suggestions for the implementation of mandatory deposit management system in Türkiye
AYBİKE MISIR
Yüksek Lisans
Türkçe
2024
Çevre Mühendisliğiİstanbul Teknik ÜniversitesiÇevre Mühendisliği Ana Bilim Dalı
PROF. DR. OSMAN ATİLLA ARIKAN
- Ortam tabanlı modülasyonlu işbirlikli dik olmayan çoklu erişim
Media-based modulated cooperative non-orthogonal multiple access
MEHMET CAN
Yüksek Lisans
Türkçe
2019
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
PROF. DR. İBRAHİM ALTUNBAŞ
- İstemci/sunucu mimarisinde veritabanı uygulamaları
Database applications with client/server architecture
SERKAN YENİDOĞAN
Yüksek Lisans
Türkçe
1999
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul ÜniversitesiBilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. ZEYNEP ALTAN
- Yüz veritabanı uygulaması yapılandırması ve yüz özniteliklerinde öğrenme yöntemlerinin veritabanına uygulanması
Face database application implementation and applying learning methods on face features to database
GİZEM İREM KOZAN
Yüksek Lisans
Türkçe
2014
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
PROF. TAYFUN AKGÜL