Geri Dön

Sparse representation frameworks for inference problems in visual sensor networks

Görsel algılayıcı ağlarındaki istatiksel çıkarım problemleri için seyrek temsil yöntemleri

  1. Tez No: 418670
  2. Yazar: SERHAN COŞAR
  3. Danışmanlar: DOÇ. DR. MÜJDAT ÇETİN
  4. Tez Türü: Doktora
  5. Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2013
  8. Dil: İngilizce
  9. Üniversite: Sabancı Üniversitesi
  10. Enstitü: Mühendislik ve Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Elektronik Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 204

Özet

Görsel algılayıcı ağları (GAAlar), görüntü işleme ve algılayıcı ağları konularını birleştiren yeni bir araştırma alanıdır. GAAlar, bir imge algılayıcı, bir gömülü işlemci ve bir kablosuz alıcı/vericiden oluşan kamera düğümleri denilen küçük görsel algılayıcı düğümlerinden oluşmaktadır. Bir kablosuz ağda birden fazla kameranın bulunması, görüntü işlemede ya da algılayıcı ağlarında olmayan kendine has ve zor problemler yaratmaktadır. Kamera düğümlerindeki pil gücü ve bantgenişliği gibi kaynak kısıtları nedeniyle, veri işlemenin ve kameralar arasındaki işbirliğinin verimli bir şekilde yapılması çok önemlidir. Bu tezde, GAAlarda gözetleme işlerinde kullanılmak üzere seyrek-temsil tabanlı yöntemler anlatılmaktadır. Haberleşmenin kısıtlı olduğu GAA ortamında, hedef takibi, tanıma, vb. gözetleme işleri yapmak son derece zordur. Sıkıştırılmış algılama, bir işaretin uygun bir uzayda seyrek temsili olduğu ön bilgisine kullanarak çok az sayıdaki gözlem verisinden işareti geri çatmak için kullanılan bir tekniktir. Seyrek temsil araçlarının az sayıdaki gözlem verisinden işaretleri geri çatma özelliği GAAlarda işleme, haberleşme ve işbirliği yaparken ortaya çıkan sınırlamalara çok uygundur. Bu sebepten dolayı, bu tez GAAlardaki hareket tanıma ve insan takibi uygulamarında kullanılabilecek yeni seyreklik-güdümlü yöntemler sunmaktadır. İlk olarak, sınıflandırma problemini bir optimizasyon problemine çeviren seyreklik-güdümlü bir hareket tanıma yöntemi önerilmiştir. Optimizasyon problemi l1 düzenleştiricisi ile seyreklik zorlayarak çözülmekte ve hareket tanıma gerçekleştirilmektedir. Yöntemimizin üstünlüğü gözlem verilerinin düşük-çözünürlükte, engellenmiş ve gürültülü olduğu durumlarda gösterilmiştir. Bildiğimiz kadarıyla, bu yöntem seyrek temsil kullanan ilk hareket tanıma yöntemidir. Ek olarak, bu yöntem GAA kaynak kısıtlarına uygun bir hali getirilmiştir. Ayrıca, iki farklı hareket tanıma problemi kullanılarak seyrekliğin sınıflandırmadaki etkisi incelenmiştir. İkinci olarak, görsel algılayıcı ağlarındaki insan takibi uygulamaları için bir öznitelik sıkıştırma yöntemi önerilmiştir. Bu yöntemde, merkezi olmayan takip işlemi gerçekleştirilmiştir: her kamera kendi elde ettiği imgelerden önemli öznitelikleri çıkartır ve onları, çok-görüşlü imge özniteliklerini toplayan ve takibi gerçekleştiren bir füzyon düğümüne gönderir. Takip işleminde, öznitelik çıkartmak genelde bir olabilirlik fonksiyonu yaratmaktadır. Ağdaki haberleşmeyi azaltmak için, bu fonksiyonlar, önce bloklara ayırılarak, her blok uygun bir uzaya dönüştürülerek ve bu temsildeki sadece en önemli katsayıları alınarak, sıkıştırılmaktadır. Bildiğimiz kadarıyla, GAAlardaki takip uygulamalarında elde edilen özniteliklerin sıkıştırılması daha önce hiç önerilmemiştir. Yöntemimiz, iç mekan ve dış mekan takip senaryolarında uygulanmıştır. Deneysel sonuçlar göstermektedir ki, yöntemimiz haberleşmeyi azaltmak için imgeleri sıkıştıran merkezi yöntemlere kıyasla bantgenişliğinin %99.6'sını kazandırabilmektedir. Ayrıca, yöntemimizin varolan merkezi olmayan yöntemlerden daha iyi çalıştığı da gösterilmiştir. Son olarak, yukarıdaki takip yöntemi geliştirilmiş ve GAAlarda insan takibi için seyreklilik-güdümlü bir yöntem önerilmiştir. Gözlem senaryosundaki belirgin geometriden yararlanan özel sözlükler tasarlanmış ve bu sözlükler olabiliklik fonksiyonlarının seyrek temsilinde kullanılmıştır. Olabilirlik fonksiyonlarının yapısına uyumlu sözlükler elde ederek, fonksiyonlar çok az sayıda katsayı ile temsil edebilmekte, böylece ağdaki haberleşme azaltılabilmektedir. Bu yöntem seyrek temsil kullanarak olabilirlik fonksiyonlarını sıkıştıran ve GAAlarda bu fikri uygulayan literatürdeki ilk yöntemdir. Yöntemimiz iç mekan ve dış mekan takip senaryolarında test edilmiştir ve yöntemimizin öznitelik sıkıştırma yöntemimizden daha çok bantgenişliği kazandırdığı gösterilmiştir. Ayrıca, yöntemimizin var olan merkezi olmayan ve dağıtık yöntemlerden da daha iyi çalıştığı gösterilmiştir.

Özet (Çeviri)

Visual sensor networks (VSNs) form a new research area that merges computer vision and sensor networks. VSNs consist of small visual sensor nodes called camera nodes, which integrate an image sensor, an embedded processor, and a wireless transceiver. Having multiple cameras in a wireless network poses unique and challenging problems that do not exist either in computer vision or in sensor networks. Due to the resource constraints of the camera nodes, such as battery power and bandwidth, it is crucial to perform data processing and collaboration efficiently. This thesis presents a number of sparse-representation based methods to be used in the context of surveillance tasks in VSNs. Performing surveillance tasks, such as tracking, recognition, etc., in a communication-constrained VSN environment is extremely challenging. Compressed sensing is a technique for acquiring and reconstructing a signal from small amount of measurements utilizing the prior knowledge that the signal has a sparse representation in a proper space. The ability of sparse representation tools to reconstruct signals from small amount of observations fits well with the limitations in VSNs for processing, communication, and collaboration. Hence, this thesis presents novel sparsity-driven methods that can be used in action recognition and human tracking applications in VSNs. A sparsity-driven action recognition method is proposed by casting the classification problem as an optimization problem. We solve the optimization problem by enforcing sparsity through l1 regularization and perform action recognition. We have demonstrated the superiority of our method when observations are low-resolution, occluded, and noisy. To the best of our knowledge, this is the first action recognition method that uses sparse representation. In addition, we have proposed an adaptation of this method for VSN resource constraints. We have also performed an analysis of the role of sparsity in classification for two different action recognition problems. We have proposed a feature compression framework for human tracking applications in visual sensor networks. In this framework, we perform decentralized tracking: each camera extracts useful features from the images it has observed and sends them to a fusion node which collects the multi-view image features and performs tracking. In tracking, extracting features usually results a likelihood function. To reduce communication in the network, we compress the likelihoods by first splitting them into blocks, and then transforming each block to a proper domain and taking only the most significant coefficients in this representation. To the best of our knowledge, compression of features computed in the context of tracking in a VSN has not been proposed in previous works. We have applied our method for indoor and outdoor tracking scenarios. Experimental results show that our approach can save up to 99.6% of the bandwidth compared to centralized approaches that compress raw images to decrease the communication. We have also shown that our approach outperforms existing decentralized approaches. Furthermore, we have extended this tracking framework and proposed a sparsity-driven approach for human tracking in VSNs. We have designed special overcomplete dictionaries that exploit the specific known geometry of the measurement scenario and used these dictionaries for sparse representation of likelihoods. By obtaining dictionaries that match the structure of the likelihood functions, we can represent likelihoods with few coefficients, and thereby decrease the communication in the network. This is the first method in the literature that uses sparse representation to compress likelihood functions and applies this idea for VSNs. We have tested our approach for indoor and outdoor tracking scenarios and demonstrated that our approach can achieve bandwidth reduction better than our feature compression framework. We have also presented that our approach outperforms existing decentralized and distributed approaches.

Benzer Tezler

  1. Örgüt topluluklarında yeni örgüt formlarının oluşumu: Türkiye ve Avrupa bağlamında bir araştırma

    Formation of new organizational forms in organizational populations: A study in the context of Türkiye and Europe

    SENCER ÖZEL

    Doktora

    Türkçe

    Türkçe

    2024

    İşletmeGalatasaray Üniversitesi

    İşletme Ana Bilim Dalı

    PROF. DR. NACİYE AYLİN ATAAY SAYBAŞILI

  2. Eliptik kuaterniyon matrislerinin tekil değer ayrışımı ve onların görüntü işlemedeki uygulamaları

    Singular value decomposition of elliptic quaternion matrices and their applications in image processing

    BEYZA ÇELİK

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    MatematikSakarya Üniversitesi

    Matematik Ana Bilim Dalı

    DOÇ. DR. HİDAYET HÜDA KÖSAL

  3. Compressive sensing methods for multi-contrast magnetic resonance imaging

    Manyetik rezonans görüntüleme için sıkıştırılmış algılama yöntemleri

    ALPER GÜNGÖR

    Yüksek Lisans

    İngilizce

    İngilizce

    2017

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. FATOŞ TUNAY YARMAN VURAL

    YRD. DOÇ. DR. TOLGA ÇUKUR

  4. Blind separation of bounded sources based on sparse representation

    Seyrek temsile dayalı olarak sınırlı kaynakların kör ayrılması

    EREN BABATAŞ

    Doktora

    İngilizce

    İngilizce

    2020

    Elektrik ve Elektronik MühendisliğiKoç Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    PROF. DR. ALPER TUNGA ERDOĞAN