Multipath querying of hierarchically tree structured document databases in vector spaces
Vektör uzayında sıradüzensel ağaç yapısı ile düzenlenmiş metin veri tabanlarının çoklu yollar üzerinden sorgulanması
- Tez No: 152583
- Danışmanlar: PROF. DR. FİKRET GÜRGEN, YRD. DOÇ. DR. ULUĞ BAYAZIT
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2004
- Dil: İngilizce
- Üniversite: Boğaziçi Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: İnşaat Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 68
Özet
ÖZET VEKTÖR UZAYINDA SIRADÜZENSEL AĞAÇ YAPISI İLE DÜZENLENMİŞ METİN VERİ TABANLARININ ÇOKLU YOLLAR ÜZERİNDEN SORGULANMASI Günümüzde gelişmiş bilgi tarama teknolojileri, kolay ve hızlı olmasından dolayı vektör uzay kavramı üzerine kurulmuştur. Genellikle metin tipi veri tabanları doküman başlıklarının indekslenmesiyle oluşturulan vektör uzaylarında oldukça büyük ve seyrek matrisler olarak tanımlanır. Bu matris uzayında istenilen ya da buna yakın bir konudaki dokümanların araştırılması (sorgulanması) büyük zaman alır ve araştırma sonucuna ulaşılabilmesi için oldukça çok sayıda hesaplama yapılması gerekir. Literatürde yapılan çalışmalarda büyük boyutlu metin veri tabanlarına boyut indirgenmesi uygulandıktan sonra bu yeni boyutlarda tanımlanan her bir dokümanın tek tek taranmasıyla sonuca varılan yöntemler tanımlanmıştır. Bu çalışmada ise boyut indirgemesi göz ardı edilerek, sıradüzensel ağaç yapısı ile istenilen dokümanların aynı gruplara toplanması ve araştırmanın bu alt gruplardaki daha az sayıdaki benzer dokümanlardan oluşturulan ortalama merkez vektörler üzerinden çoklu yollar kullanılarak yapılması önerilmiş ve bu yöntem literatürde sıkça kullanılan Gizli Anlambilimsel Dizinleme Yöntemi ile karşılaştırılmıştır. Böylece tüm veri tabanına bakılması yerine çok daha az sayıdaki dokümana bakıldığından daha az sayıda hesaplama yapılarak sorgulama sonucuna kısa zamanda ulaşılması sağlanacaktır. Gruplamaların sıradüzensel bir ağaç yapısıyla yapılması, böylece sorgulamanın ağaç içerisinde özyineli olarak belirlenecek olan grubun içindeki alt gruplara yönlendirilmesiyle aramanın küçük gruplarda yapılması önerilmiştir. Bu sıradüzensel ağaç yapısı ile farklı boyutlarda düzenlenmiş olan IEEE metin veri tabanlarının Sabit ve Uyarlanabilir Çoklu Yollar üzerinden sorgulanması ve hesap karmaşıklığı, başarım ödünleşmeleri incelenmekte ve karşılaştırılmaktadır.
Özet (Çeviri)
IV ABSTRACT MULTIPATH QUERYING OF HIERARCHICALLY TREE STRUCTURED DOCUMENT DATABASES IN VECTOR SPACES Recently developed information retrieval technologies are based on the concept of a vector space due to the fact that it is speedy and simple to deal with zeros and ones. Generally, text databases are huge matrices defined in the vector spaces that are specially formed by indexing the titles of documents. Searching through these databases to find documents related to our desired subject takes a long time and lots of calculations have to be done. In the literature, methods are used with dimension reduction by means of SVD or PCS, then defining the documents in new dimensions and then searching all of the documents in the reduced dimensions one by one to find the relevant documents about a desired subject. In addition to say that the dimension reduction also accelerates to search documents in hierarchical tree representation because of less calculation while dealing with reduced dimension matrices. In this study, we do not use a reduction of dimension but also compare the results with other Information Retrieval Methods like LSI or Cosine Similarity Algorithm. Making the grouping as a hierarchical tree structure is proposed, so that it can be possible to direct the search to smaller groups in each step. Static M-Path Algorithm and Adaptive M-Path Algorithm search are proposed in IEEE. Transaction in Information Theory databases with three different dimensions which are 544 x 301, 1218 x 801 and 1600 x 1228. By these methods the searching complexity is reduced and the number of calculation gets smaller. Another finding is the fact that a result to a search is related to the query vector. Generally, the more keywords that a search vector contains, the larger is the probability of finding a good result (a closer document to the query vector) but the nice or worst hierarchical tree design can lead to better or worst results of our searching.
Benzer Tezler
- Çok yollu iletişim kanal parametrelerinin kestirimi
Estimation of the parameters of a multi path channel
SÜLEYMAN YALÇINKAYA
Yüksek Lisans
Türkçe
1995
Elektrik ve Elektronik MühendisliğiKaradeniz Teknik ÜniversitesiY.DOÇ.DR. TEMEL KAYIKÇIOĞLU
- Turbo dengeleme
Turbo equalization
BURCU KUTLUKAYA
Yüksek Lisans
Türkçe
2008
Elektrik ve Elektronik MühendisliğiHacettepe ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
PROF. DR. MEHMET ŞAFAK
YRD. DOÇ. DR. EMRE AKTAŞ
- MPTCP ve SDN teknolojilerini kullanarak dayanıklı bir ağ altyapısı oluşturma
Building a resilient network infrastructure using MPTCP and SDN technologies
ELİF ÖZÇEVİK
Yüksek Lisans
Türkçe
2021
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolEge ÜniversitesiUluslararası Bilgisayar Ana Bilim Dalı
DOÇ. DR. MÜGE SAYIT
- Predictive and adaptive channel estimation models for cooperative wireless communications
İşbirlikli kablosuz haberleşme için öngörüsel ve adaptif kanal kestirim modelleri
OMAR GATERA
Doktora
İngilizce
2017
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
PROF. DR. AHMET HAMDI KAYRAN
- Haberleşme sistemlerinde enerji optimizasyonu ile etkin kanal katsayı adedinin en aza indirgenmesi
Minimizing the number of effective channel taps by energy optimization in communications systems
ÜNZÜLE ŞENOL KIZILKAYA
Yüksek Lisans
Türkçe
2019
Elektrik ve Elektronik MühendisliğiKocaeli ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ SULTAN ALDIRMAZ ÇOLAK