Improving diversity of search results for the National Library of Turkey
Millî Kütüphane arama sonuçlarında konu çeşitlendirme iyileştirmesi
- Tez No: 686427
- Danışmanlar: DR. ÖĞR. ÜYESİ TAYFUN KÜÇÜKYILMAZ
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Çeşitlendirme, Info-Gain, MMR, LDA, Maksimum Uç İlgililik, Gizli Dirichlet Tahsisi, Diversification, Info-Gain, Maximum Marginal Relevance, MMR, Latent Dirichlet Allocation, LDA
- Yıl: 2021
- Dil: İngilizce
- Üniversite: TED Üniversitesi
- Enstitü: Lisansüstü Programlar Enstitüsü
- Ana Bilim Dalı: İnteraktif Bilişim Sistemleri Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 99
Özet
Arama sistemlerinin temel amaçlarından birisi kullanıcıların bilgi ihtiyaçlarına yönelik arama sonuçları sağlayarak kullanıcı tecrübesini iyileştirmektir. Çok çeşitli arama sonuçlarının sağlanması, kullanıcı ihtiyaçlarının yerine getirilme ihtimalini arttırarak, arama sistemi hizmet kalitesine katkı sağlar. Yaygın olarak web arama kullanılmasına rağmen, çeşitlendirme teknikleri serbest metin olmayan arama sistemlerine sıklıkla uygulanmazdı. Çalışmamızda, kütüphane katalog arama sistemleri için çeşitlendirilmiş arama altyapısı hazırladık. Hazırlanan çalışmayı, Milli Kütüphane'nin gerçek verileri ile test ettik. Çalışmamızda, birkaç farklı yaklaşım hazırladık ve çalışma alt yapımızı hem sonuçların ilgililiği hem de sonuçların çeşitliliği açısından geniş bir parametre aralığında test ettik. Sonunda hazırlanan model dokümanların kategorilerini keşfetmek için genel bir yaklaşım olan LDA tabanlı bir otomatik doküman kategorizasyon tekniğini benimsedik. Arama sonuçlarını çeşitlendirmek için (Maksimum Uç İlgililik) MMR tabanlı teknik kullandık. Hazırladığımız altyapı arama sonuçlarının çeşitliliği üzerinde oldukça önemli ölçüde iyileştirme (%66.7) sağlarken, ilgililiği (%1.9 kayıp) kabul edilebilir seviyede tutmuştur.
Özet (Çeviri)
One of the main objectives of search systems is to improve the quality of the user experience by providing search results that are relevant to the user's information need. Providing a diverse set of search results contribute to the quality of service of a search system as it increases the possibility of satisfying the user's information need. Although literature suggests that diversification techniques are used for the Web search, they are not applied often to non-free text search systems. In this work, we propose a diversified search framework for library catalog search systems. The work presented here is tested on a real-world dataset acquired from the National Library of Turkey. We have experimented the effects of changes in a wide range of parameters for our framework, testing the effectiveness, both in terms of search result diversity and result relevance. To this end, the proposed models adopt an automatic document categorization technique as a generic approach to the category discovery of the documents based on Latent Dirichlet Allocation (LDA). For diversification of the search results, we modified and used a Maximum Marginal Relevance (MMR)-based technique. The proposed framework achieved significant improvements on search result diversity (66.7%) while maintaining acceptable levels of relevance (1.9% loss).
Benzer Tezler
- Şanlıurfa'da endüstriyel simbiyoz döngüsü için bir öneri
A recommendation for industrial symbiosis cycle in Sanliurfa
BÜŞRA ŞENOCAK
Yüksek Lisans
Türkçe
2021
Şehircilik ve Bölge Planlamaİstanbul Teknik ÜniversitesiŞehir ve Bölge Planlama Ana Bilim Dalı
DOÇ. DR. MEHMET ALİ YÜZER
- Perakende piyasalarında dayanıksız tüketim ürünleri ile ilgili gelişmeler -bireysel markalı ürünlerde satın alma davranışı
Developments regarding fast moving consumer goods at retail markets-buying behavior at the private label products
K. SELÇUK TUZCUOĞLU
- An empirical investigation on improving fairness testing for machine learning models
Makine öğrenme modelleri için adalet testlerinin geliştirilmesi üzerine ampirik bir araştırma
UMUTCAN KARAKAŞ
Yüksek Lisans
İngilizce
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. AYŞE TOSUN KÜHN
- Taşıt debriyaj elemanlarının optimizasyonu için yapay zeka algoritması tabanlı bir sistemin geliştirilmesi
Development of a system based on artificial intelligence algorithm for the optimization of vehicle clutch components
ALPER KARADUMAN
Doktora
Türkçe
2022
Otomotiv MühendisliğiBursa Uludağ ÜniversitesiOtomotiv Mühendisliği Ana Bilim Dalı
PROF. DR. ALİ RIZA YILDIZ
- Relaying opportunities for wireless networks by applying network coding
Kablosuz ağlar için ağ kodlamalı aktarma fırsatları
SEMİHA TEDİK BAŞARAN
Doktora
İngilizce
2019
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
PROF. DR. GÜNEŞ ZEYNEP KARABULUT KURT