Geri Dön

Multipath querying of hierarchically tree structured document databases in vector spaces

Vektör uzayında sıradüzensel ağaç yapısı ile düzenlenmiş metin veri tabanlarının çoklu yollar üzerinden sorgulanması

  1. Tez No: 152583
  2. Yazar: UĞUR AYAN
  3. Danışmanlar: PROF. DR. FİKRET GÜRGEN, YRD. DOÇ. DR. ULUĞ BAYAZIT
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2004
  8. Dil: İngilizce
  9. Üniversite: Boğaziçi Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: İnşaat Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 68

Özet

ÖZET VEKTÖR UZAYINDA SIRADÜZENSEL AĞAÇ YAPISI İLE DÜZENLENMİŞ METİN VERİ TABANLARININ ÇOKLU YOLLAR ÜZERİNDEN SORGULANMASI Günümüzde gelişmiş bilgi tarama teknolojileri, kolay ve hızlı olmasından dolayı vektör uzay kavramı üzerine kurulmuştur. Genellikle metin tipi veri tabanları doküman başlıklarının indekslenmesiyle oluşturulan vektör uzaylarında oldukça büyük ve seyrek matrisler olarak tanımlanır. Bu matris uzayında istenilen ya da buna yakın bir konudaki dokümanların araştırılması (sorgulanması) büyük zaman alır ve araştırma sonucuna ulaşılabilmesi için oldukça çok sayıda hesaplama yapılması gerekir. Literatürde yapılan çalışmalarda büyük boyutlu metin veri tabanlarına boyut indirgenmesi uygulandıktan sonra bu yeni boyutlarda tanımlanan her bir dokümanın tek tek taranmasıyla sonuca varılan yöntemler tanımlanmıştır. Bu çalışmada ise boyut indirgemesi göz ardı edilerek, sıradüzensel ağaç yapısı ile istenilen dokümanların aynı gruplara toplanması ve araştırmanın bu alt gruplardaki daha az sayıdaki benzer dokümanlardan oluşturulan ortalama merkez vektörler üzerinden çoklu yollar kullanılarak yapılması önerilmiş ve bu yöntem literatürde sıkça kullanılan Gizli Anlambilimsel Dizinleme Yöntemi ile karşılaştırılmıştır. Böylece tüm veri tabanına bakılması yerine çok daha az sayıdaki dokümana bakıldığından daha az sayıda hesaplama yapılarak sorgulama sonucuna kısa zamanda ulaşılması sağlanacaktır. Gruplamaların sıradüzensel bir ağaç yapısıyla yapılması, böylece sorgulamanın ağaç içerisinde özyineli olarak belirlenecek olan grubun içindeki alt gruplara yönlendirilmesiyle aramanın küçük gruplarda yapılması önerilmiştir. Bu sıradüzensel ağaç yapısı ile farklı boyutlarda düzenlenmiş olan IEEE metin veri tabanlarının Sabit ve Uyarlanabilir Çoklu Yollar üzerinden sorgulanması ve hesap karmaşıklığı, başarım ödünleşmeleri incelenmekte ve karşılaştırılmaktadır.

Özet (Çeviri)

IV ABSTRACT MULTIPATH QUERYING OF HIERARCHICALLY TREE STRUCTURED DOCUMENT DATABASES IN VECTOR SPACES Recently developed information retrieval technologies are based on the concept of a vector space due to the fact that it is speedy and simple to deal with zeros and ones. Generally, text databases are huge matrices defined in the vector spaces that are specially formed by indexing the titles of documents. Searching through these databases to find documents related to our desired subject takes a long time and lots of calculations have to be done. In the literature, methods are used with dimension reduction by means of SVD or PCS, then defining the documents in new dimensions and then searching all of the documents in the reduced dimensions one by one to find the relevant documents about a desired subject. In addition to say that the dimension reduction also accelerates to search documents in hierarchical tree representation because of less calculation while dealing with reduced dimension matrices. In this study, we do not use a reduction of dimension but also compare the results with other Information Retrieval Methods like LSI or Cosine Similarity Algorithm. Making the grouping as a hierarchical tree structure is proposed, so that it can be possible to direct the search to smaller groups in each step. Static M-Path Algorithm and Adaptive M-Path Algorithm search are proposed in IEEE. Transaction in Information Theory databases with three different dimensions which are 544 x 301, 1218 x 801 and 1600 x 1228. By these methods the searching complexity is reduced and the number of calculation gets smaller. Another finding is the fact that a result to a search is related to the query vector. Generally, the more keywords that a search vector contains, the larger is the probability of finding a good result (a closer document to the query vector) but the nice or worst hierarchical tree design can lead to better or worst results of our searching.

Benzer Tezler

  1. Çok yollu iletişim kanal parametrelerinin kestirimi

    Estimation of the parameters of a multi path channel

    SÜLEYMAN YALÇINKAYA

    Yüksek Lisans

    Türkçe

    Türkçe

    1995

    Elektrik ve Elektronik MühendisliğiKaradeniz Teknik Üniversitesi

    Y.DOÇ.DR. TEMEL KAYIKÇIOĞLU

  2. Turbo dengeleme

    Turbo equalization

    BURCU KUTLUKAYA

    Yüksek Lisans

    Türkçe

    Türkçe

    2008

    Elektrik ve Elektronik MühendisliğiHacettepe Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    PROF. DR. MEHMET ŞAFAK

    YRD. DOÇ. DR. EMRE AKTAŞ

  3. MPTCP ve SDN teknolojilerini kullanarak dayanıklı bir ağ altyapısı oluşturma

    Building a resilient network infrastructure using MPTCP and SDN technologies

    ELİF ÖZÇEVİK

    Yüksek Lisans

    Türkçe

    Türkçe

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolEge Üniversitesi

    Uluslararası Bilgisayar Ana Bilim Dalı

    DOÇ. DR. MÜGE SAYIT

  4. Predictive and adaptive channel estimation models for cooperative wireless communications

    İşbirlikli kablosuz haberleşme için öngörüsel ve adaptif kanal kestirim modelleri

    OMAR GATERA

    Doktora

    İngilizce

    İngilizce

    2017

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    PROF. DR. AHMET HAMDI KAYRAN

  5. Haberleşme sistemlerinde enerji optimizasyonu ile etkin kanal katsayı adedinin en aza indirgenmesi

    Minimizing the number of effective channel taps by energy optimization in communications systems

    ÜNZÜLE ŞENOL KIZILKAYA

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    Elektrik ve Elektronik MühendisliğiKocaeli Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ SULTAN ALDIRMAZ ÇOLAK