Geri Dön

Multi-modal stereo-vision using infrared/visible camera pairs

Görünür ve kızılötesi kamera çiftleri kullanarak çoklu biçimli steryo görme

  1. Tez No: 383250
  2. Yazar: MUSTAFA YAMAN
  3. Danışmanlar: YRD. DOÇ. DR. SİNAN KALKAN
  4. Tez Türü: Doktora
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2014
  8. Dil: İngilizce
  9. Üniversite: Orta Doğu Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 228

Özet

Bu tezde, kızılötesi ve görünür bantta kamera çiftleri kullanılarak yeni bir çoklu biçimli steryo görme yöntemi önerilmiştir. Yöntem karşılıklı bilgiyi temel benzerlik ölçüsü olarak kullanmaktadır. Ancak karşılıklı bilgi değerinin üretilmesinde bölütleme temelli bir uyarlanır pencere mekanizması önerilmiş ve sonuçlar oldukça geliştirilmiştir. Ayrıca yöntem maliyet matrisini hesaplarken, negatif karşılıklı bilgi değerine ek olarak önsel olasılık değerlerini de hesaba katmaktadır. Yeni bir uyarlanır maliyet toplama yöntemi de ayrıca önerilmiş ve bu yöntemde maliyet güvenilirlikleri hesaplanarak toplama işlemi gerçekleştirilirken, en küçük maliyetle eşleştirilen piksel farklılıklarından yeterince güvenilir olanlar ise daha sonra bölütlere göre düzleme oturtulmuştur. Bölütler yinelemeli olarak güvenilir farklılık değerlerine göre birleştirilip parçalanarak düzeltilmekte ve farklılık haritası hesaplamasının ilk bölütlemeye olan bağımlılığı azaltılmaktadır. Son olarak tüm bu adımlar yinelenmektedir. Yeni adımlarda daha önce üretilmiş olan farklılık haritası da kullanılarak daha doğru ön olasılık değerleri kullanılabilmektedir. Önerilen yöntemi ve literatürde yer alan diğer yöntemleri değerlendirmek için iki farklı çoklu biçimli steryo görüntü veri kümesi oluşturularak kullanılmıştır: Middlebury Steryo Değerlendirme veri kümesinden sentetik olarak değiştirilmiş görüntü çiftleri ve Kinect cihazından elde edilen kızılötesi ve görünür kamera görüntü çiftleri. Veri kümeleri çoklu-biçimli steryo görme yöntemleri için performans değerlendirme test veri kümesi olarak kullanılabilecek şekilde oluşturulmuştur. Bu veri kümelerinde, (i) önerilen yöntemin varolan karşılıklı bilgi formulasyonuna göre sonuçları iyileştirdiği, (ii) önerilen yöntemin literatürde yer alan diğer yöntemlerden daha iyi performans gösterdiği, ve (iii) önerilen yöntemin Kinect derinlik verisi ile karşılaştırılabilir derecede iyi derinlik verisi elde edebildiği gösterilmiştir.

Özet (Çeviri)

In this thesis, a novel method for computing disparity maps from a multi-modal stereo-vision system composed of an infrared-visible camera pair is introduced. The method uses mutual information as the basic similarity measure where a segmentation-based adaptive windowing mechanism is proposed along with a novel mutual information computation surface for greatly enhancing the results. Besides, the method incorporates joint prior probabilities when computing the cost matrix in addition to negative mutual information measures. A novel adaptive cost aggregation method is also proposed using computed cost confidences and resulting minimum cost disparities that are confident enough are fitted planes in segments. The segments are refined by iteratively splitting and merging according to the fitted confident disparities that helps to reduce the dependence of the disparity computation to the initial segmentation. Finally, all the steps are repeated iteratively where more accurate joint probabilities are calculated by using previous iteration's disparity map. Two multi-modal stereo image datasets are generated for evaluating the method and the state of the art methods confronted in literature; the synthetically altered image pairs from the Middlebury Stereo Evaluation Dataset, and our own dataset of Kinect Device infrared- visible camera image pairs, which can function as a benchmark for multimodal stereo-vision methods. On these datasets, it is presented that (i) the proposed method improves the quality of existing MI formulation, (ii) the proposed method outperforms state of the art methods in literature, and (iii) the proposed method can provide depth comparable to the quality of Kinect depth data.

Benzer Tezler

  1. Multi-modal statistics of local image structures and its applications for depth prediction

    Başlık çevirisi yok

    SİNAN KALKAN

    Doktora

    İngilizce

    İngilizce

    2007

    MatematikGeorg-August-Universität Göttingen

    PROF. FLORANTİN WÖRGÖTTER

    PROF. NORBERT KRÜGER

  2. Dağıtılmış nesnesel birim modeli ve paralel algoritmaları gerçekleme yöntemleri

    Distributed component object model and methods of implementing parallel algorithms

    CENKER ŞİŞMAN

  3. Grafik işlemci birimi üzerinde genel amaçlı hesaplama yöntemi ile görüntülerin gerçek zamanlı ortorektifikasyonu

    Real time orthorectification of images by general purpose computation on graphical processing units method

    HAKAN ŞAHİN

    Doktora

    Türkçe

    Türkçe

    2016

    Jeodezi ve Fotogrametriİstanbul Teknik Üniversitesi

    Geomatik Mühendisliği Ana Bilim Dalı

    PROF. DR. MEHMET SITKI KÜLÜR

  4. Yakın resim fotogrametrisinde mikrofotogrametrik uzman sistem tasarımı, tesisi ve kalibrasyonu

    A micro-photogrammetric expert systems design, application and calibration in close range photogrammetry

    BAHADIR ERGÜN

    Doktora

    Türkçe

    Türkçe

    2003

    Jeodezi ve Fotogrametriİstanbul Teknik Üniversitesi

    Jeodezi ve Fotogrametri Mühendisliği Ana Bilim Dalı

    PROF. DR. ORHAN ALTAN

  5. Development of a framework for surgery robotics

    Ameliyat robotları için yazılım iskeleti tasarlama

    MURAT BİLEN

    Yüksek Lisans

    İngilizce

    İngilizce

    2012

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBaşkent Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. MUSTAFA DOĞAN