Terim ağırlıklandırma modellerinin ardıl işlemede kullanılması
Using term weighting models in post-processing
- Tez No: 291024
- Danışmanlar: PROF. DR. BAHAR KARAOĞLAN
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belge kümeleri üzerinden bilgi geri getirimi, bağımsızlıktan sapma, ağırlıklandırma modelleri, bilgi geri getirim değerlendirmesi, Information retrieval on documents clusters, divergence from independence, weighting models, information retrieval evaluation
- Yıl: 2011
- Dil: Türkçe
- Üniversite: Ege Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Uluslararası Bilgisayar Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 69
Özet
Tez çalışması kapsamında bilgi erişim sistemlerinde geri getirilen belge listesinin iyileştirilmesi konusu araştırılmıştır. Hedef, herhangi bir ağırlıklandırma modeliyle erişilen belgelerin alakalı olanlarının daha üst sıralarda yer almasını sağlamaktır. Bilgi erişim sistemi olarak java programlama diliyle gerçekleştirilmiş Terrier kütüphanesi kullanılmıştır. Bilgi erişim sistemlerinde sıklıkla kullanılan ağırlıklandırma modelleriyle getirilen kümelenmiş belgeler üzerinden tekrar erişim sağlanarak modellerin etkinliği araştırılmıştır.Tekrar erişim sırasında iki farklı yol izlenmiştir. İlki, herhangi bir ağırlıklandırma modeli kullanılarak getirilen belgelerin üzerinden farklı bir ağırlıklandırma modeli ile tekrar puan hesaplanarak yeni bir sonuç listesi elde etmek, ikincisi ise getirilen belgeler tekrar indekslenip farklı bir ağırlıklandırma modeliyle erişim sağlamaktır. Bu yöntemlerle elde edilen sonuçlar incelenmiştir. Belirli konu etrafında toplanan daraltılmış derlem üzerinden tekrar erişim yapıldığında tezde kullanılan modellerin genelinin başarı değerlerini düşürdüğü görülmüştür. Sadece `TF_IDF' metodunun küçük ve büyük hacimli derlemlerde standart bir sonuç verdiği gözlemlenmiştir.
Özet (Çeviri)
In this thesis, improving the quality of retrieved file list in information retrieval systems has been researched. The aim is to put the documents which are most relevant, to the user query in the upper rows in the retrieved list. As information retrival system, a java based library called Terrier has been used. The effectiveness of the most widely known (term weighting) models on the document clusters has been investigated by issuing the same queries on the previously retrieved documents (re- retrieving).Two different paths have been taken in re-retrieving. First one is to get new result list by recalculating the scores with different term weighting model on retrieved files by using one of the term weighting models, second is re-indexing the retrieved files and retrieving them with another term weighting model. The results from those approches are investigated. The results show that the performance values decline when the known models are used on the corpus consisting of previously retrieved files, which gather around the queried terms. Only `TF_IDF? method has been observed to give norm result in small and large size collections.
Benzer Tezler
- Urban agriculture site selection in Beylikduzu, İstanbul
İstanbul Beylikdüzü'nde kentsel tarım alan seçimi
AYŞE BURCU KISACIK
Yüksek Lisans
İngilizce
2023
Şehircilik ve Bölge Planlamaİstanbul Teknik ÜniversitesiŞehir ve Bölge Planlama Ana Bilim Dalı
PROF. DR. TURGAY KEREM KORAMAZ
- Lexicon-based emotion analysis in Turkish
Türkçe metinlerde sözlük tabanlı duygu analizi
MANSUR ALP TOÇOĞLU
Doktora
İngilizce
2018
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolDokuz Eylül ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. ADİL ALPKOÇAK
- Belge derlemlerinde sorgu terimlerinin frekans dağılımlarının analizi ve sorguya göre en uygun terim ağırlıklandırma modelinin seçimi
Analysis of the frequency distributions of query terms on document collections & per-query selection of best term weighting model
AHMET ARSLAN
Doktora
İngilizce
2016
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAnadolu ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. BEKİR TANER DİNÇER
- İleri istatistiksel yöntemler kullanarak rüzgârdan üretilen elektriksel gücün tahmini
Wind-electric power forecast using advanced statistical methods
SERKAN BUHAN
Doktora
Türkçe
2015
Elektrik ve Elektronik MühendisliğiHacettepe ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
PROF. DR. IŞIK ÇADIRCI
- A graph neural network model with adaptive weights for session-based recommendation systems
Oturum tabanlı öneri sistemleri için uyarlanabilir ağırlıklara sahip bir çizge sinir ağı modeli
BEGÜM ÖZBAY
Yüksek Lisans
İngilizce
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. ŞULE ÖĞÜDÜCÜ
DR. RESUL TUGAY