Geri Dön

Gövdelemenin ve gömünün türkçe bir bilgi erişim sistemi üzerindeki etkisinin araştırılması

A Study on the effects of stemming and thesaurus for retrieving information in Turkish documents

  1. Tez No: 97873
  2. Yazar: MEHMET EROĞLU
  3. Danışmanlar: DOÇ. DR. HAYRİ SEVER
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2000
  8. Dil: Türkçe
  9. Üniversite: Hacettepe Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 168

Özet

IV ÖZET Bilgi Erişim Sistemleri (Information Retrieval Systems), çağımızda bilgi teknolojilerindeki hızlı gelişme ile beraber büyük miktardaki verilerin elektronik ortamlarda tutarlı ve güvenli bir şekilde saklanıp, gerektiğinde bu bilgilere kolay ve hızlı bir şekilde, otomatik olarak erişilmesi amacıyla geliştirilmiş sistemlerdir. Araştırmacıların hızla artan bilgi gereksinimlerini karşılamada kullanabilecekleri vazgeçilmez, belki de işlevi açısından biricik araç konumundadır. 60'h yıllardan başlayarak, bilgisayar teknolojisi ile birlikte bir gelişme süreci gösteren BES'lerinin Türkiye'ye yansıması süreklilik arzetmemiştir. Değişik zamanlarda, değişik araştırma grupları tarafından çeşitli çalışmalar yapılmışsa da, henüz Türkçe dokümanlar üzerinde işlem yapabilecek bir BES geliştirilmemiştir. Bu amaçla Hacettepe Üniversitesi bünyesinde 1997 yılında“Kaşgarh Mahmut Bilgi Geri-Getirim (KM-BGS)”projesi başlatılmıştır. KM-BGS genişletilmiş Boole modelinde çalışan, geribildirimli deneysel bir BES'dir. Proje kapsamında şu ana kadar, Türkçe gövdeleme algoritması gövdebul geliştirilmiş ve projeye temel olacak SMART BES'nin Türkçe yerelleştirilmesi yapılmıştır. Tez kapsamında, sistem için bir el kitabı (manual) hazırlanmış ve şu aşamada vektör uzayı modelinde olan KM-BGS'nin performans ölçümleri ve analizleri yapılmıştır. Bu amaçla daha sonraki çalışmalara kaynaklık edebilecek orta ölçekli bir belge koleksiyonu (benchmark) oluşturulmuştur. Performans ölçümleri, sisteme yerleştirilen Türkçe gövdeleme algoritmasının ve üretilen değişik boylardaki gömülerin erişim performansı üzerindeki etkilerinin araştırılması olmak üzere iki noktada olmuştur. Yapılan deneysel çalışmalar sonucunda, geliştirilen KM-BGS'nin Türkçe belgeler için kabul edilebilir bir erişim performansına sahip olduğu görülmüştür.

Özet (Çeviri)

V ABSTRACT Information Retrieval Systems are the kind of systems which have been developed in order to keep huge amount of data, which are a result of the rapid development in Information Technologies, in electronic media consistently and safely and to retrieve the data easily, rapidly and automatically when needed. These systems are indispensable and even unique in terms of their functions for researchers to meet their ever increasing information needs. Beginning from the sixties, the reflections of Information Retrieval Systems, which followed a parallel development process with computer technologies, on Turkey was not continual and stable. Even though at different times various studies were carried out by different research groups, an Information Retrieval System which is able to work on Turkish documents hasn't been developed yet. To this end, a project named“Kaşgarlı Mahmut Information Retrieval System (Kaşgarlı Mahmut Bilgi Geri Getirim Sistemi)”was started in 1997 under the frame of Hacettepe University. KM-BGS is an experimental Information Retrieval System which runs under Extended Boolean Model. So far Turkish stemming algoritm (gövdebul) has been developed within the frame of this project and Turkish localisation of SMART Information Retrieval System which is considered to be the basis of the project has been achieved. A (manual) handbook has been prepared within the frame of the thesis and performance measurements and analysis of KM-BGS which is yet in vector space model have been completed. To this end, a middle scaled benchmark of documents to be used as a resource for later studies has been formed. Performance measurements have been focused on two points: research on the Turkish stemming algoritm which was installed into the system and the effects of thesaurus which was produced at different wave lengths on retrieval performance. As a result of the completed experimental studies it was seen that KM-BGS has an acceptable retrieval performance for Turkish documents.

Benzer Tezler

  1. Türkçe'de hesaplamalı metin analizi

    Computational text analysis in turkish

    SENEM KUMOVA METİN

    Doktora

    Türkçe

    Türkçe

    2011

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolEge Üniversitesi

    Uluslararası Bilgisayar Ana Bilim Dalı

    PROF. DR. BAHAR KARAOĞLAN

  2. Gürbüz bilgi erişimi için seçkili gövdeleme

    Selective stemming for robust information retrieval

    GÖKHAN GÖKSEL

    Doktora

    Türkçe

    Türkçe

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolEskişehir Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. AHMET ARSLAN

    PROF. DR. BEKİR TANER DİNÇER

  3. Multiword expression detection using word vector representations

    Sözcük temsilleri kullanarak çok sözcüklü ifade tespiti

    TANSU TAŞÇIOĞLU

    Yüksek Lisans

    İngilizce

    İngilizce

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİzmir Ekonomi Üniversitesi

    Bilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı

    DOÇ. DR. SENEM KUMOVA METİN

  4. A study on wireless channel models: simulation of fading, shadowing and further applications

    Kablosuz kanal modelleri üzerine bir çalışma: sönümlemenin, gölgelemenin ve daha ileri uygulamaların benzetimi

    ALİ ARSAL

    Yüksek Lisans

    İngilizce

    İngilizce

    2008

    Elektrik ve Elektronik Mühendisliğiİzmir Yüksek Teknoloji Enstitüsü

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. SERDAR ÖZEN

  5. Kar ve fırtına devriği sarıçam gövdelerinin endüstriyel ürün olarak hazırlanmasında çalışma veriminin belirlenmesi (Ardahan-Yalnızçam Orman İşletme Şefliği örneği)

    Determination of working efficiency in the preparation of snow and thunder torn yellow pine bodies as a industrial product (Ardahan-Yalnizcam Forest Management Department case)

    ENDER GÖK

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    Ormancılık ve Orman MühendisliğiArtvin Çoruh Üniversitesi

    Orman Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ALİ KARAMAN