Geri Dön

Gürbüz bilgi erişimi için seçkili gövdeleme

Selective stemming for robust information retrieval

  1. Tez No: 776486
  2. Yazar: GÖKHAN GÖKSEL
  3. Danışmanlar: DOÇ. DR. AHMET ARSLAN, PROF. DR. BEKİR TANER DİNÇER
  4. Tez Türü: Doktora
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2022
  8. Dil: Türkçe
  9. Üniversite: Eskişehir Teknik Üniversitesi
  10. Enstitü: Lisansüstü Eğitim Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Bilgisayar Yazılımı Bilim Dalı
  13. Sayfa Sayısı: 105

Özet

Gövdelemenin bir bilgi erişim sisteminin performansını artırması beklenir, ancak pratikte, daha önceden elde edilmiş deneysel sonuçlar bunun her zaman geçerli olmadığını göstermektedir. Tezde, gövdelemenin sorgu bazında uygulanıp uygulanmayacağına karar veren seçkili bir gövdeleme yaklaşımı önerilmektedir. Metodumuz, anlamsal olarak ilişkili dokümanların geri getirilmesinde gövdelemeden kaynaklanan başarısızlık riskini en aza indirmeyi amaçlamaktadır. Tez, gövdelemenin bir bilgi erişim sisteminde nasıl seçkili bir şekilde uygulanabileceğini tanıtmasının yanı sıra; kelimelerin gövdeleme uygulanmadan önceki ve sonraki terim frekanslarından türetilen bir dizi yeni öznitelik önererek bilgi erişim literatürüne katkıda bulunur. Önerilen yöntem, hem bazı mevcut sorgu performansı tahmin edicilerinden hem de yeni türetilmiş özniteliklerden ve denetimli sınıflandırma yapan bir makine öğrenme tekniğinden yararlanır. Yöntem, üç kural tabanlı gövdeleme algoritması ile TREC ve NTCIR'da yer alan sekiz sorgu seti kullanılarak değerlendirilir. WSJ doküman koleksiyonu hariç kullanılan doküman koleksiyonları, sayısı 25 milyon ile 733 milyon arasında değişen Web dokümanlarından oluşmaktadır. Deneylerin sonuçları, yöntemin, sistemin gürbüzlüğünü artıran ve sorgular arasında başarısızlık riskini (sorgu başına performans kayıpları) en aza indirerek doğru seçimler yapabildiğini göstermektedir. Sonuçlar ayrıca, yöntemin çoğu sorgu seti için tekil sistemlerden sistematik olarak daha yüksek bir ortalama geri getirim performansına ulaştığını göstermektedir.

Özet (Çeviri)

Stemming is supposed to improve the average performance of an information retrieval system, but in practice, past experimental results show that this is not always the case. In this thesis, a selective approach to stemming that decides whether stemming should be applied or not on a query basis is proposed. Our method aims at minimizing the risk of failure caused by stemming in retrieving semantically related documents. The thesis contributes to the information retrieval literature by proposing an application of selective stemming and introducing a set of new features derived from the term frequencies of the words and their stems produced by different stemming algorithms. The proposed method leverages both some of the existing query performance predictors and the newly derived features, and a supervised classification (machine learning) technique. It is evaluated using three rule-based stemmers and eight query sets of the standard TREC and NTCIR tracks. The document collections used, except WSJ document collection, consist of Web documents ranging in number from 25 million to 733 million. The results of the experiments show that the method is capable of making accurate selections that increase the robustness of the system and minimize the risk of failure (i.e., per-query performance losses) across queries. The results also show that the method attains systematically higher average retrieval performance than the single systems for most query sets.

Benzer Tezler

  1. Belge erişiminde teknolojik yaklaşım

    Başlık çevirisi yok

    SALİH LÜTFİ GÜRBÜZ

    Doktora

    Türkçe

    Türkçe

    1990

    Bilgi ve Belge YönetimiHacettepe Üniversitesi

    PROF.DR. M. ADİL ARTUKOĞLU

  2. Directional regularization based variational models for image recovery

    Görüntü onarımı için yön güdümlü düzenlemeye dayalı varyasyonel modeller

    EZGİ DEMİRCAN TÜREYEN

    Doktora

    İngilizce

    İngilizce

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. MUSTAFA ERSEL KAMAŞAK

  3. Autolanding control system design with deep learning based fault estimation

    Derin öğrenme tabanlı hasar tespitli gürbüz otomatik iniş kontrol sistemi

    BATUHAN EROĞLU

    Yüksek Lisans

    İngilizce

    İngilizce

    2019

    Uçak Mühendisliğiİstanbul Teknik Üniversitesi

    Uçak ve Uzay Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ NAZIM KEMAL ÜRE

  4. Tarımda bilgi yönetim sistemleri ve TARBİL

    Information management system in agriculture and TARBİL

    FİKRET BAYAR

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    ZiraatBursa Uludağ Üniversitesi

    Tarım Ekonomisi Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ İSMAİL BÜLENT GÜRBÜZ

  5. İstanbul'da bir sivil toplum kuruluşuna beslenme danışmanlığı için başvuran Suriyeli göçmen kadınlarda ana-çocuk sağlığı ve beslenmeyle ilgili özelliklerin değerlendirilmesi

    Evaluation of mother-child health and nutritional characteristics of Syrian migrant women applying to a non-governmental organization in Istanbul for nutritional counseling

    BUSE GÜRBÜZ

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    Beslenme ve DiyetetikSağlık Bilimleri Üniversitesi

    Halk Sağlığı Ana Bilim Dalı

    DOÇ. DR. DERYA ÇAMUR