Geri Dön

Bilgi erişimde ilgi sıralamalarının artırımlı olarak geliştirilmesi

Incremental refinement of relevance rankings in information retrieval

  1. Tez No: 731058
  2. Yazar: MÜGE AKBULUT
  3. Danışmanlar: PROF. DR. YAŞAR AHMET TONTA
  4. Tez Türü: Doktora
  5. Konular: Bilgi ve Belge Yönetimi, Information and Records Management
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2022
  8. Dil: Türkçe
  9. Üniversite: Hacettepe Üniversitesi
  10. Enstitü: Sosyal Bilimler Enstitüsü
  11. Ana Bilim Dalı: Bilgi ve Belge Yönetimi Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 114

Özet

İlgi sıralaması algoritmaları erişilen belgeleri arama sorgularıyla belgeler arasındaki konusal benzerlik (ilgi) derecelerine göre sıralamaktadır. Fakat bazen sıralamada birbirine çok benzeyen kaynaklara ek olarak sorgulanan konunun çeşitli yönlerini ele alan makalelere de ihtiyaç duyulmaktadır. Bu yüzden özellikle literatür taramalarında erişilen makalelerin konu çeşitliliği de önemlidir. Dahası, ilgi sıralamaları kullanıcıların bilgi ihtiyaçlarına göre kişiselleştirilebilmelidir. Bu çalışmanın amacı yeni bir ilgi sıralaması yöntemi geliştirmektir. Bu amaçla önce 65 sorgu için arXiv'den alınan iSearch derlemindeki yaklaşık 435 bin fizik makalesinin özetlerine LDA (Latent Dirichlet Allocation – Gizli Dirichlet Ayırımı) olasılıksal konu modelleme algoritması uygulanarak ilgi sıralamaları elde edilmiştir. Daha sonra bu sıralamalar ilgi kuramı, bilgi erişim ve bibliyometriye dayanarak geliştirilen pennant erişim yöntemiyle desteklenerek artırımlı olarak geliştirilmiş yeni ilgi sıralamaları oluşturulmuştur. Bulgular konu modelleme algoritması ile elde edilen ilgi sıralamaları atıf verileriyle bütünleştirildiğinde (1) ilgi düzeyleri daha yüksek ve çeşitli makaleler içeren daha zenginleştirilmiş ilgi sıralamaları oluşturulabileceğini, (2) sıralamaların kullanıcıların ihtiyaçlarına/önceliklerine göre kişiselleştirilerek yeniden sıralanabileceğini ve (3) erişim çıktılarının görselleştirilerek literatürün daha kolay izlenebileceğini göstermektedir. Bu araştırma LDA konu modelleme algoritması ile elde edilen ilgi sıralamalarının atıf verilerine dayanan pennant erişim teknikleriyle artırımlı olarak geliştirilebileceğini gösteren ilk çalışmadır. İlgi sıralamalarını oluşturmak için kullanılan veriler (özet ve başlıklar, toplam atıf ve ortak atıf sayıları) atıf dizinlerinde mevcuttur. Dolayısıyla geliştirdiğimiz yöntem hesaplama, sağlamlık, tekrarlanabilirlik ve ölçeklenebilirlik sorunları çözümlendiğinde yakın gelecekte, örneğin, Web of Science, Scopus ve TR-Dizin'de kullanılabilir.

Özet (Çeviri)

Relevance ranking algorithms rank retrieved documents based on the degrees of topical similarity (relevance) between search queries and documents. However, in some cases, sources that address various aspects of a queried topic are needed in addition to the articles that demonstrate a high level of similarity with the search query. Therefore, topical diversity of retrieved articles is also essential, especially in literature search results. Moreover, relevance rankings should be personalized based on users' information needs. The aim of this study is to develop a new relevance ranking method. To that end, firstly, the relevance rankings for 65 search queries were obtained by applying the LDA (Latent Dirichlet Allocation) probabilistic topic modeling algorithm to the abstracts of some 435,000 physics articles in the iSearch corpus taken from arXiv. Then, these rankings were supported by the pennant retrieval method based on relevance theory, information retrieval, and bibliometrics, and incrementally refined new relevance rankings were created. Findings show that when the relevance rankings obtained by the topic modeling algorithm are fused with the citation data: (1) more enriched relevance rankings containing higher relevance levels with more diverse articles can be created; (2) the rankings can be personalized based on users' information needs; and (3) the literature can be followed more easily by visualizing the retrieval outputs. Our research is the first to show that LDA-based relevance rankings can be incrementally refined with the pennant retrieval techniques based on citation data. The data used to create relevance rankings such as titles, abstracts, and the total number of citations and co-citations are readily available in the citation indexes. Hence, the method we developed can be used in, for instance, Web of Science, Scopus, and TR-Dizin in the near future once the computation, robustness, reproducibility, and scalability issues are resolved.

Benzer Tezler

  1. Elektronik ticaret sitelerinde promosyonların müşteri satınalma davranışlarına etkisi

    The effect of promotions on customer purchasing behaviors in electronic commerce websites

    HASAN KAHVECİ

    Yüksek Lisans

    Türkçe

    Türkçe

    2022

    İşletmeİbn Haldun Üniversitesi

    İşletme Ana Bilim Dalı

    PROF. DR. MUSTAFA KEMAL YILMAZ

  2. Türk tıp literatüründe bilgi erişim

    Information access to Turkish medical literature

    AYŞEN KÜYÜK

    Yüksek Lisans

    Türkçe

    Türkçe

    1996

    Bilgi ve Belge YönetimiHacettepe Üniversitesi

    PROF.DR. NİLÜFER TUNCER

  3. Etmenlerin işbirlikli bilgi filtrelemesinde kullanılması üzerine bir çalışma

    A study on the use of agents in collaborative information filtering

    OYLUM ALATLI

    Yüksek Lisans

    Türkçe

    Türkçe

    2004

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolEge Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    Y.DOÇ.DR. AYLİN KANTARCI

  4. Ağ trafiğinin analizi, anomali tespiti ve değerlendirme

    Analysis of network traffic, anomaly detection and evaluation

    AKIN ASLAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2017

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilişim Uygulamaları Ana Bilim Dalı

    DOÇ. DR. ENVER ÖZDEMİR

  5. Exploring opinions of corporate instructional designers on their professional development and training needs

    Kurumsal öğretim tasarımcılarının mesleki gelişim ve eğitim ihtiyaçları konusundaki görüşlerinin araştırılması

    NAZLI GÖKALP

    Yüksek Lisans

    İngilizce

    İngilizce

    2025

    Eğitim ve ÖğretimOrta Doğu Teknik Üniversitesi

    Eğitim Programları ve Öğretimi Ana Bilim Dalı

    DR. ELİF ÖZTÜRK