Geri Dön

Data sensitive approximate query approaches in metric spaces

Metrik uzaylarda veri duyarlı yaklaşık sorgulama yöntemleri

  1. Tez No: 287397
  2. Yazar: MERVE DİLEK
  3. Danışmanlar: DOÇ. DR. İBRAHİM KÖRPEOĞLU
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2011
  8. Dil: İngilizce
  9. Üniversite: İhsan Doğramacı Bilkent Üniversitesi
  10. Enstitü: Mühendislik ve Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Bölümü
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 72

Özet

Benzerlik taraması veri kümelerinden ilgili bilginin elde edilmesi işlemidir. İlgi dahilindeki veri kümeleri özellikle resim, görüntü, ses kaydı, protein ve DNAdizisi gibi karmaşık ve düzensiz veriler içerirler. İlgilenilen bilgi genellikle iki yaygın sorgu türünden bir tanesi kullanılarak tanımlanır: Menzil sorgusu, verilen sorgu nesnesinin belirli bir uzaklığı içerisinde kalan bütün nesnelerin elde edilmesini kapsar. Öte yandan en yakın k-komşu sorgusu, sorgu nesnesine en yakın k veritabanı nesnesinin elde edilmesi ile ilgilenir. Belirtilen sorgu türlerini uygulayabilmek amacıyla metrik uzay kavramına dayanan çeşitli indeks yapıları önerilmiştir.Önerilen bu indeks yapılarının sorgu performansları özellikle yüksek boyutlu veri kümeleri için çok tatmin edici olmamıştır. Çözüm olarak, kullanıcılara kalite/zaman ödünleşim imkanı sunan çeşili yaklaşık benzerlik taraması yöntemleri geliştirilmiştir. Bu yaklaşım, kullanıcıların sorgu doğruluğundan ödün vererek sorgu sonuçlarına görece daha hızlı erişmek istemeleri ilkesine dayanmaktadır. Önerilen yaklaşık tarama tasarıları genelde altta kullanılan veri yapılarına çok bağımlıdırlar. Bu durum, bu tasarıların dayandığı temel fikirlerin kalite açısından kıyaslanabilmesini zorlaştırmaktadır.Bu tezde, benzerlik sorgularının cevap süresini kısaltabilmek için farklı yaklaşık benzerlik yöntemleri araştırlımıştır. Bu yöntemler, elimizdeki veri kümesinden elde edilen çeşitli istatistiksel bilgileri kullanarak her sorgu nesnesine özgü dinamik (sorgulama esnasında gerçekleşen) yönlendirmeye olanaksağlamaktadırlar. Deneyler basit bir pivot-tabanlı indeks yapısı üzerinde çalıştırılarak alttaki yapının yaklaşık benzerlik tasarılarına etkisi azaltılmıştır. Sonuçlar, veri kümesine ve sorgu nesnesine duyarlı yönlendirmenin performans/doğruluk hususunda iyileştirme sağlayabileceğini göstermektedir.

Özet (Çeviri)

Similarity searching is the task of retrieval of relevant information from datasets. We are particularly interested in datasets that contain complex and unstructured data such as images, videos, audio recordings, protein and DNA sequences. The relevant information is typically defined using one of two common query types: a range query involves retrieval of all the objects within a specified distance to the query object; whereas a k-nearest neighbor query deals with obtaining k closest database objects to the query object. A variety of index structures based on the notion of metric spaces have been offered to process these two query types.The query performances of the proposed index structures have not been satisfactory particularly for high dimensional datasets. As a solution, various approximate similarity search methods offering the users a quality/time trade-off have been proposed. The rationale is that the users might be willing to tolerate query precision to retrieve query results relatively faster. The proposed approximate searching schemes usually have strong connections to the underlying data structures, making the comparison of the quality of the essence of their ideas difficult.In this thesis we investigate various approximation approaches to decrease the response time of similarity queries. These approaches use a variety of statistics about the dataset in order to obtain dynamic (at the time of querying) and specific guidance on the approximation for each query object individually. The experiments are performed on top of a simple underlying pivot-based index structure to minimize the effects of the index to our approximation schemes. The results show that it is possible to improve the performance/precision of the approximation based on data and query object sensitive guidance.

Benzer Tezler

  1. Büyük hacimli görüntü veri tabanlarında hızlı görüntü arama

    Fast image search on high dimensional image database

    OSMAN DURMAZ

    Doktora

    Türkçe

    Türkçe

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. HASAN ŞAKİR BİLGE

  2. How cryptographic implementations affect mobile agent systems

    Şifreleme gerçekleştirmelerinin gezgin aracı internet sistemlerini nasıl etkilediği

    İSMAİL ULUKUŞ

    Yüksek Lisans

    İngilizce

    İngilizce

    2003

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi Üniversitesi

    Sistem ve Kontrol Mühendisliği Ana Bilim Dalı

    PROF. DR. EMİN ANARIM

  3. Location obfuscation and distance-based attacks on private trajectories: An experimental evaluation on real trajectory data sets

    Konum gizleme ve özel yörüngeler üzerinde uzaklık temelli saldırılar: Gerçek yörünge veri kümesi üzerinde deneysel değerlendirme

    ASLI KAYA

    Yüksek Lisans

    İngilizce

    İngilizce

    2015

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSabancı Üniversitesi

    Bilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı

    DOÇ. DR. YÜCEL SAYGIN

  4. Study of chaotic behaviour of nonlinear physiological signals

    Doğrusal olmayan fizyolojik işaretlerde kaotik davranışın irdelenmesi

    REMZİ ŞEKER

    Yüksek Lisans

    İngilizce

    İngilizce

    1997

    Elektrik ve Elektronik MühendisliğiÇukurova Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    DOÇ. DR. SOKOL SALİU

  5. Yönsel verilerin kümelenmesinde bulanık C-ortalamalar algoritması

    Fuzzy C-means clustering algorithm for directional data

    ÖZGE TEZEL

    Yüksek Lisans

    Türkçe

    Türkçe

    2014

    İstatistikKaradeniz Teknik Üniversitesi

    İstatistik ve Bilgisayar Bilimleri Ana Bilim Dalı

    YRD. DOÇ. DR. ORHAN KESEMEN