Geri Dön

Terim ağırlıklandırma modellerinin ardıl işlemede kullanılması

Using term weighting models in post-processing

  1. Tez No: 291024
  2. Yazar: SERHAN ŞEN
  3. Danışmanlar: PROF. DR. BAHAR KARAOĞLAN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belge kümeleri üzerinden bilgi geri getirimi, bağımsızlıktan sapma, ağırlıklandırma modelleri, bilgi geri getirim değerlendirmesi, Information retrieval on documents clusters, divergence from independence, weighting models, information retrieval evaluation
  7. Yıl: 2011
  8. Dil: Türkçe
  9. Üniversite: Ege Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Uluslararası Bilgisayar Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 69

Özet

Tez çalışması kapsamında bilgi erişim sistemlerinde geri getirilen belge listesinin iyileştirilmesi konusu araştırılmıştır. Hedef, herhangi bir ağırlıklandırma modeliyle erişilen belgelerin alakalı olanlarının daha üst sıralarda yer almasını sağlamaktır. Bilgi erişim sistemi olarak java programlama diliyle gerçekleştirilmiş Terrier kütüphanesi kullanılmıştır. Bilgi erişim sistemlerinde sıklıkla kullanılan ağırlıklandırma modelleriyle getirilen kümelenmiş belgeler üzerinden tekrar erişim sağlanarak modellerin etkinliği araştırılmıştır.Tekrar erişim sırasında iki farklı yol izlenmiştir. İlki, herhangi bir ağırlıklandırma modeli kullanılarak getirilen belgelerin üzerinden farklı bir ağırlıklandırma modeli ile tekrar puan hesaplanarak yeni bir sonuç listesi elde etmek, ikincisi ise getirilen belgeler tekrar indekslenip farklı bir ağırlıklandırma modeliyle erişim sağlamaktır. Bu yöntemlerle elde edilen sonuçlar incelenmiştir. Belirli konu etrafında toplanan daraltılmış derlem üzerinden tekrar erişim yapıldığında tezde kullanılan modellerin genelinin başarı değerlerini düşürdüğü görülmüştür. Sadece `TF_IDF' metodunun küçük ve büyük hacimli derlemlerde standart bir sonuç verdiği gözlemlenmiştir.

Özet (Çeviri)

In this thesis, improving the quality of retrieved file list in information retrieval systems has been researched. The aim is to put the documents which are most relevant, to the user query in the upper rows in the retrieved list. As information retrival system, a java based library called Terrier has been used. The effectiveness of the most widely known (term weighting) models on the document clusters has been investigated by issuing the same queries on the previously retrieved documents (re- retrieving).Two different paths have been taken in re-retrieving. First one is to get new result list by recalculating the scores with different term weighting model on retrieved files by using one of the term weighting models, second is re-indexing the retrieved files and retrieving them with another term weighting model. The results from those approches are investigated. The results show that the performance values decline when the known models are used on the corpus consisting of previously retrieved files, which gather around the queried terms. Only `TF_IDF? method has been observed to give norm result in small and large size collections.

Benzer Tezler

  1. Urban agriculture site selection in Beylikduzu, İstanbul

    İstanbul Beylikdüzü'nde kentsel tarım alan seçimi

    AYŞE BURCU KISACIK

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Şehircilik ve Bölge Planlamaİstanbul Teknik Üniversitesi

    Şehir ve Bölge Planlama Ana Bilim Dalı

    PROF. DR. TURGAY KEREM KORAMAZ

  2. Lexicon-based emotion analysis in Turkish

    Türkçe metinlerde sözlük tabanlı duygu analizi

    MANSUR ALP TOÇOĞLU

    Doktora

    İngilizce

    İngilizce

    2018

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolDokuz Eylül Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ADİL ALPKOÇAK

  3. Belge derlemlerinde sorgu terimlerinin frekans dağılımlarının analizi ve sorguya göre en uygun terim ağırlıklandırma modelinin seçimi

    Analysis of the frequency distributions of query terms on document collections & per-query selection of best term weighting model

    AHMET ARSLAN

    Doktora

    İngilizce

    İngilizce

    2016

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAnadolu Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. BEKİR TANER DİNÇER

  4. İleri istatistiksel yöntemler kullanarak rüzgârdan üretilen elektriksel gücün tahmini

    Wind-electric power forecast using advanced statistical methods

    SERKAN BUHAN

    Doktora

    Türkçe

    Türkçe

    2015

    Elektrik ve Elektronik MühendisliğiHacettepe Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    PROF. DR. IŞIK ÇADIRCI

  5. A graph neural network model with adaptive weights for session-based recommendation systems

    Oturum tabanlı öneri sistemleri için uyarlanabilir ağırlıklara sahip bir çizge sinir ağı modeli

    BEGÜM ÖZBAY

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. ŞULE ÖĞÜDÜCÜ

    DR. RESUL TUGAY