Bayes tümleştirme teknikleri kullanılarak yüzey kurma ve ayrıt sezme
Visual surface recontruction and boundary detection using bayesian integration
- Tez No: 39177
- Danışmanlar: PROF.DR. ERDAL PANAYIRCI
- Tez Türü: Doktora
- Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 1993
- Dil: Türkçe
- Üniversite: İstanbul Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Belirtilmemiş.
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 149
Özet
ÖZET Bayes Tümleştirme Teknikleri Kullanarak Yüzey Kurma ve Ayrıt Sezme 3-Boyutlu (3-B lu) nesne algılama ve tanıma, kalite kontrol, robotik, uzaktan algılama gibi çok çeşitli alanlarda kullanılan bigisayar ile görü dizgelerinde en önemli adımdır. 3-B lu nesne algılama ve tanımada yaygın bir teknik, görsel bilgiden bir düzenlileştirme (regularization) yöntemi kullanılarak ve belirlenen bir düzlük (smoothness) varsayımı ile nesnelere ait 3-B lu yüzeylerin elde edilmesidir. Gerçek dünyanın yüzeyleri düz, ayrıtlarında süreksizlikler içeren nesnelerden oluştuğu varsayımı altında güvenilir bir yüzey kurma işleminin süreksizlikler sezilmeksizin başarılamayacağı açıktır, imgelerdeki süreksizlikler teorik olarak nesne yüzeyleri arasındaki ayrıtlar olarak tanımlanırlar. Bu nedenle son yıllarda nesne algılama dizgelerinde görsel yüzey kurma (visual surface reconstruction) ve ayrıt sezme (boundary detection) birlikte gerçeklenmektedir [4], [9], [20]. Böylece sadece nesne ayrıtlarının sezimine veya sadece nesne yüzeylerinin saptanmasına dayanan yöntemlerin sakıncaları aşılabilmektedir. Teknik yazında yüzey kurma ve ayrıt sezme işlemini birlikte gerçekleyen bazı metodlar geliştirilmiştir. Terzopoulos [19] tarafından önerilen süreklilik (continuation) metodunda süreksizlikler eğriliğin fazla olduğu noktalara kademeli olarak atanmakta sonuçta tek bir ayrıt imgesi elde edilmektedir. Geman [12] tarafından stokastik eniyilemeye dayalı metodlarda Markov raslantı alanı modellerinin (MRF) kullanılması önerilmiş daha sonra bu modeller Marroquin [22] tarafından yüzey kurma ve ayrıt sezme proble mine uygulanmıştır. Koch [72] bu stokastik yöntemlere alternatif olarak sinir ağlarına dayalı belirlenebilir bir yaklaşım önermiştir. Blake ve Zisserman [21] yüzeyleri zayıf sınırlamalar kullanarak basitçe modelleyen“weak membrane (WM)”ve“weak plate ”modellerini geliştirmiştir. Bu çalışmada, MRF modellerini WM yaklaşımı ile birleştiren bir modelleme önerildi. Görsel yüzey kurma ve ayrıt sezme problemi, Bayesci bir yaklaşımla, gözlenen gürültülü imgeden gerçek derinlik bilgisi ve nesne ayrıtlarının çıkarılması, bir başka deyişle, gerçek imgeye ait derinlik ve ayrıt etiketlerinin MAP öngörüsü ile bulunması olarak tanımlandı. Gerçek imge bir bağlaşımlı Markov raslantı alam (coupled MRF) çifti,(x, l), ile modellendi. x koyuluk (derinlik) süreci, l çizgi süreci (line process) olarak adlandırıldı ve herbir süreç olasılık dağılımı Gibbs süreci olan birer MRF vile modellendi. Önsel bilginin modellenmesinde, imgedeki süreksizlik leri doğrudan ve tam olarak belirleyebilmeleri, düzleştirme parametresinin süreksizlikleri koruyarak kontroluna olanak tanımaları, ve ayrıt ve derin lik (koyuluk) bilgisine ilişkin sınırlamaları birlikte sağlamaları nedeniyle bağlaşımlı MRF modelleri kullanıldı. Bilgisayar ile görü araştırmalarında başlangıçta çoğunlukla sayısal koyuluk imgeler (intensity images) kullanılmıştır. Bu imgeler, 3-B lu yüzey koor dinatlarından 2-B lu imge düzlemine her bir göze (pixel ) elemanına bir parlaklık düzeyi atayarak yapılan bir izdüşürme işlemi ile elde edilirler ve derinlik algılanmasında doğrudan kullanılacak herhangibir bilgi içermezler. Oysa, nesnelerin 3-B lu uzayda algılanmasında, sistem girişindeki imgeler den çıkarılacak derinlik bilgisi temel rol oynar. Derinlik bilgisi çıkarıldıktan sonra imgenin 2.5-B lu olarak adlandırılan [47] gösterimi oluşturulabilir. 2.5- B lu gösterim nesnelerin görülebilen yüzeyleri hakkında belirtik (expilicit) bilgi sağlar ve imgenin içerdiği nesneler hakkında belli bir varsayım gerek tirmeyen son önalgılama aşamasıdır. Tüm bu nedenlerle koyuluk imgeleri 3-B lu nesne algılama ve tanıma iş lemlerinde yetersiz bulunmuş, yerine yeni sayısallaştırma yöntemleri gelişti rilmiştir. Gözlenen bir imgeye ilişkin derinlik bilgisi genel olarak üç temel yöntemle elde edilir:. 'stereo' sistemler kullanılarak,. yapısal ışıklandırma (structured lighting) sistemleri ile,. laser ışm demetinin gidiş-dönüş süresine göre nesnelerin uzaklığım be lirleyen sistemler (time-of-flight range finders) ile. 'Stereo' sistemler ve yapısal ışıklandırma sistemlerinde yoğun (dense) derin lik bilgisinin doğrudan elde edilememesi ve kullanılan dönüşümlerin birebir olmaması önemli oranda bilgi kaybına neden olmaktadır. Son yıllarda hem aktif hem de pasif algılayıcılardan derinlik bilgisi içeren sayısallaştırılmış erim imgeler (range images) elde edilebilmektedir [49]. Sayısal bir erim imge, i imge satırlarını, j imge sütunlarını göstermek üzere, herbir (i,j) gözesine karşı düşen f(i, j) derinlik değerlerinden oluşur, (i, j, f(i,j)) vektörü dünya koordinatlarına basit bir doğrusal dönüşüm ile çevrilebilir. f(i, j) değerleri nesnelerin geometrisine bağlı olduğu için ve yansıma, ışıma, gölge gibi fizik sel ortama ilişkin etmenlerden bağımsız olduğu için, koyuluk imgelerinde karşılaşılan hata kaynaklarının etkisi erim imgelerinde söz konusu değildir. ıxPratik birçok uygulamada erim tarayıcıları, görüntüleme radarları gibi veri toplayıcılardan elde edilen derinlik bilgisi, CCD kameralar ile elde edilen koyuluk bilgisinden farklı özellikler gösterir. Bu farklılığın bir sonucu olarak, koyuluk imgelerinde yüksek başarım sağlayan ve özünde imgedeki keskin gri düzeyi geçişlerini ayrıt olarak yakalayan doğrusal yöntemler derinlik verisinde yeterli başarımı sağlayamazlar. Bu nedenle, yapılan çalışmada öncelikle önerilen stokastik yüzey kurma ve ayrıt sezme yaklaşımının koyu luk ve erim imgelerindeki başarımı incelendi (Bölüm 3). Gözlenen veriyi daha iyi modelleyebilmek amacı ile“weak membrane”modeli çizgi ve koyu luk (derinlik) süreçlerinde ek ilişkiler tanımlayarak genişletildi. MRF model lerinin, imgeyi simgeleyen önsel olasılık dağılımında yapılan bu genişletmeler ile koyuluk ve erim imgelerinde istenen başarımı sağladığı nicel ölçütler kul lanılarak gösterildi. İnsan algılama sisteminin nesneleri algılamada renk, doku, derinlik, koyu luk gibi aynı imgeye ait farklı bilgileri tümleştirerek bir sonuca vardığı açıktır [1]. Derinlik ve koyuluk bilgisinin algılama sistemindeki önemi ne deni ile özellikle erim ve koyuluk imgelerinin tümleştirilmesi yüzey kurma ve ayrıt sezme işleminde başarımı arttırmaktadır. Sorun bu iki farklı bilgi kaynağının en verimli nasıl tümleştirilebileceğidir. Teknik yazında erim ve koyuluk imgelerinin tümleştirilmesi probleminin çözümü için belirlenebilir ve stokastik modeller geliştirilmiştir. Aggarwall [54] her imgedeki ayrıtları ayrı ayrı sezen daha sonra mantıksal bir işlev ile birleştiren bir model ö- nermiştir. Ancak bu model kullanılarak elde edilen ayrıtların yerleşiklik ve sezilme doğruluğu oldukça düşüktür. Poggio [1] olasılıksal modeller kulla narak aynı imgeden elde edilen derinlik, koyuluk, renk, stereo ve doku bilgi lerini tümleştiren bir model önermiştir. Bu çalışmada koyuluk bilgisi temel alınmış ve süreksizlikler ancak koyuluk imgesinde sezilebildiklerinde doğru kabul edilmiştir. Chou [26] koyuluk bilgisini derinlik süreksizliklerini sapta mada bir ön bilgi olarak kullanarak erim ve koyuluk imgelerini tümleştiren bir model önermiştir. Jain ve Nadabar [56] aynı yaklaşımı koyuluk sü reksizliklerini belirlenebilir bir yöntem ile saptayarak genişletmişlerdir. Bu çalışmada, yüzey kurma ve ayrıt sezme problemine bir çözüm olarak, aynı imgeye ait erim ve koyuluk imgelerinin Bayes yaklaşımı kullanılarak tüm- leştirilmesine dayanan bir metod önerilmektedir (Bölüm 4). Farklı kay naklardan alman bilginin en iyi bir şekilde süreksizlik noktalarında tümleş- tirilebileceği yaklaşımı [5] ile erim ve koyuluk imgelerindeki süreksizlikler herbir ayrıt elemanına bir etiket atayan ve bağlaşımlı Markov raslantı alanı ile modellenen bir ayrıt sezici kullanılarak sezilmektedir. Teknik yazında yayınlanmış çalışmalardan farklı olarak erim ve koyuluk bilgilerine eşit ön celik verilmekte ve her iki imgede de sezilebilen süreksizliklerin saptanmasısağlanmaktadır. Böylelikle koyuluk imgesindeki gölge ve buna benzer keskin ışıklılık değişmelerinden kaynaklanan süreksizliklerin ayrıt olarak sezilmesi önlenmekte, derinlik bilgisinden yararlanarak yumuşak geçişler ve eğrilik ayrıtları saptanabilmektedir. Gözlenen doğal imgelerin analizinde karşılaşılan temel sorunlardan birisi, nesnelerin ayrıtlarına karşı düşen süreksizliklerin neden olduğu derinlik ve koyuluk bilgisindeki değişimlerin çok farklı ölçeklerde ortaya çıkmasıdır. Örneğin gözlenen imgelerdeki büyük ve belirgin nesneleri ayırdetmede kaba bir ölçek kullanılabilirken ayrıntıları ayırdetmek istiyorsak daha küçük öl çekler kullanılmalıdır. Kısaca, algılanan nesnenin yüzeylerinin ve ayrıtlarının tam olarak belirlenebilmesi için ilgilenilen imgeye ait farklı ölçeklerde bir analiz yapılması ve elde edilen bilgilerin tümleştirilmesi gerekmektedir [5], [8]. Bu problemin çözümü için çok ölçekli ayrıt sezme (multiscale boundary detection) önerilmiştir [5]. Son yıllarda teknik yazında koyuluk imgelerinde çok ölçekli ayrıt sezme konusunda birçok çalışma yayınlanmıştır [6], [7], [30], [65]. Bu çalışmalarda çoğunlukla belirlenebilir' modeller geliştirilmiş ve koyuluk imgelerinin çok ölçekli gösterimlerini elde etmek için en uygun işlevin Gauss işlevi olduğu sonucuna varılmıştır [5]. Bu nedenle çalışmaların birçoğu Gauss tabanlıdır ve koyuluk imgelerine uygulanmıştır. Bu metod- larda gözlenen imge önce aktarım işlevi h(i, j; a) olan bir Gauss süzgeci ile farklı ölçeklerde evriştirilerek çok ölçekli gösterimler elde edilir. Burada a Gauss işlevinin standard sapmasını gösterir ve ölçek (scale) yada düzleştirme (smoothing) parametresi olarak adlandırılır. Kaba ölçekli gösterimler büyük a değerleri kullanılarak, ayrıntılı ölçekler küçük a değerleri kullanılarak elde edilebilir. Uygulanan düzleştirme işleminin amacı gözlenen imgedeki kes kin koyuluk geçişlerini yumuşatmaktır ve bu yumuşatma işlemi sonucun da özellikle büyük ölçeklerde süzgeç çıkışında oldukça puslu (blurred) bir imge elde edilir ve ayrıtların yerleşikliği önemli ölçüde bozulur. Elde edilen çok ölçekli gösterimlerin herbirisinde ayrıtlar ya Gauss ile düzleştirilmiş im genin Laplace dönüşümündeki sıfır geçişleri bulunarak yada gradient doğ rultusunda alınan birinci türevin maksimumları bulunarak saptanırlar ve ayrı ayrı elde edilen sonuçlar mantıksal bir işlev kullanılarak tümleştirilirler. Bu yöntemlerde temel sorun süzgeç boyutunun seçimi ve farklı ölçeklerdeki imgelerin birbirinden bağımsız analizi nedeni ile sezme ve yerleşiklik doğru luğunun düşük olmasıdır. Bu çalışmada, çok ölçekli ayrıt sezme probleminin çözümü için stokastik düzenlileştirme teknikleri kullanan doğrusal olmayan bir model önerilmek tedir [8] (Bölüm 5). Önerilen model çok ölçekli Markov raslantı alanı göste rimlerini kullanmakta ve Bayes tümleştirme teknikleri ile herbir ölçekte elde xıedilen bilginin aynı anda işlenmesine olanak tanımaktadır. Teknik yazındaki bilinen yaklaşımlardan farklı olarak önerilen model süzgeçleme veya stan dart düzenlileştirme gibi doğrusal bir metod değildir. Bir ölçekteki imge ye uygulanan işlemlerin diğer ölçekteki imgelerdeki işlemlere de etkimesini sağlayan bu metod kuvvetli bağlaşımlı (strongly coupled) veri tümleştirme [2] teknikleri grubuna sokulabilir. Gauss-tabanlı doğrusal modellerin en önemli dezavantajı olan pencere boyutu belirleme sorununu ortadan kaldırır. Önerilen metod süreksizlikleri bir çizgi süreci ile modellediği için klasik belir lenebilir metodlardaki'en önemli sorunlardan birisi olan sezme ve yerleşiklik doğruluğu arasındaki çelişkiyi ortadan kaldırır. Sonuç olarak, Bölüm 5 te stokastik düzenlileştirme teknikleri kullanılarak gerçeklenen çok ölçekli analiz Bölüm 3 ve 4 te önerilen karmaşık çizgi süreçlerine dayalı metodlara alternatif bir yaklaşım oluşturmaktadır. Bu yaklaşımlardan üstünlüğü; ölçek parametrelerinin sayısı ve değerleri belir lendikten sonra başka hiç bir parametrenin belirlenmesini gerektirmeme- sidir. Bu nedenle Bölüm 5 te erim ve koyuluk imgeleri aynı imgeye ilişkin farklı ölçeklerde gösterimler olarak kabul edildi ve geliştirilen çok ölçekli mo delin, koyuluk ve derinlik imgelerini çok ölçekli yüzey ve ayrıt bilgilerinin de yardımı ile tümleştiren bir yüzey kurma ve ayrıt sezme modeli olarak da başarı ile kullanılabileceği gösterildi. Özetlenirse, yapılan çalışmada temel amaç; erim ve koyuluk imgelerinde yüzey kurma ve ayrıt sezme probleminin çözümü için Markov raslantı alanı modellerine dayalı geçerli bir metod bulunmasıdır. Bu nedenle farklı MRF gösterimleri önerilmiş ve bunların teknik yazında önerilenler ile ilişkisi ku rulmuştur. Çalışmada problem teorik olarak bir içbükey olmayan (non- convex) eniyileme problemi olarak modellenmekte ve belirlenebilir“Gradu ated Non-Convexity (GNC)”[21] ve stokastik“Thresholded Posterior Mean (TPM)”[22] algoritmaları kullanılarak çözülmektedir. Teknik yazında 1- boyutlu işaretler için yayınlanan [31] sonuçların aksine 2-boyutta TPM algoritmasının yüzey kurma başarımının GNC den daha yüksek olduğu gösterilmektedir. Araştırmada bir sonraki adımda öncelikle önerilen modellerin Mean Field teori [70] kullanılarak belirlenebilir bir yorumu yapılacaktır. Ayrıca Markov raslantı alanı modelleri ile sinir ağları arasındaki ilişkiden [71], [72] yarar lanarak sinir ağı modelleri ile bir bağ kurulacaktır. Önerilen modellerin pratikte kullanımını sınırlayan işlem yoğunluğuna bir çözüm olarak teknik yazında son zamanlarda önerilen“multigrid”[13], [67], [68], [69] MRF gösterimlerin problemin çozümündeki başarımı incelenecektir. xu
Özet (Çeviri)
Abstract In this thesis, we examine the use of Markov random field (MRF) models in the problem of visual surface reconstruction and boundary detection by integrating information from registered intensity and range images. The thesis reports a framework based on Bayesian approach. The key idea in our approach is that fusion of information from different sources can be car ried out successfully at discontinuities using a single physically meaningful boundary label for each boundary location. Unlike the previous work in the literature, our scheme assigns equal priority to range and intensity data. The results of combining the two information modalities are encouraging and these results are better than results based on either modality operating alone. Therefore, proposed model can be interpreted as a successful appli cation of MRF models to obtain labeled physical discontinuities by fusing range and intensity images. Also, a unified treatment of reconstruction of surfaces using depth and intensity information has been developed based on coupled MRF models. The thesis also explores the performance of MRF models in integrating boundary information at multiple scales. We introduce a model which solves the multiscale boundary detection problem using the strongly coupled sen sor integration techniques that combines the a priori constraints of the mod ules as well as the data that these modules produce. In contrast to the usual approaches in the literature, our scheme is not a linear process such as filter ing or standard regularization which extracts the boundaries at each scale and then combines common edges at the outputs of independent modules. The presented scheme uses a Bayesian approach based on Markov random field models which processes multiscale representations simultaneously and combines useful information from multiple scales accurately. Unlike most of the work reported in the literature, our boundary detection scheme is based on the detection of discontinuities rather than the detection of sharp inten sity changes in the image. Therefore, it is applicable not only to intensity data but also to depth data and eliminates the dependency on smoothing operator size which is the main difficulty of Gaussian-based linear methods. In the context of this thesis, theoretically, the reconstruction problem is formulated as a nonconvex optimization problem and it is solved by us ing deterministic Graduated Non-Convexity (GNC) as well as stochastic Thresholded Posterior Mean (TPM) algorithms in the Bayesian sense. In contrast to the works reported for 1-D in the literature, it is shown that, the surface reconstruction performance of the TPM algorithm with the pro posed model is better than the GNC algorithm in 2-D. Vll
Benzer Tezler
- Derin öğrenme ve büyük veri analitiği yöntemleriKullanarak Covid-19 yayılımının ileriye dönük tahmini
Forecasting the spread of covid-19 using deep learning and big data analytics methods
CYLAS KIGANDA
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi ÜniversitesiBilgisayar Bilimleri Ana Bilim Dalı
PROF. DR. MUHAMMET ALİ AKCAYOL
- Anlamsal web tabanlı bir doğal dil soru-cevap sistemi
A semantic web based natural language question answering system
ABDULLAH TALHA KABAKUŞ
Yüksek Lisans
Türkçe
2014
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. AYDIN ÇETİN
- Erken Cumhuriyet Döneminde yerel basın yoluyla Türklüğün inşası: Van gazetesi örneği (1939-1943)
The construction of Turkishness by local press in Early Republi̇c Period: The example of Van Gazetesi (1939-1943)
ERGİN SARI
Yüksek Lisans
Türkçe
2017
GazetecilikYüzüncü Yıl ÜniversitesiSosyoloji Ana Bilim Dalı
DOÇ. DR. MEHMET ZEKİ DUMAN
- Bayes optimizasyon yöntemi kullanılarak evrişimsel sinir ağlarında hiper parametre optimizasyonu
Hyper parameter optimization in convolutional neural networks using Bayesian optimization method
ZEYNEP NADİROĞLU
Yüksek Lisans
Türkçe
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolVan Yüzüncü Yıl ÜniversitesiYapay Zeka ve Robotik Ana Bilim Dalı
DOÇ. DR. MUZAFFER ATEŞ
- Software design, implementation, application, and refinement of a bayesian approach for the assessment of content and user qualities
Bayes yaklaşımı kullanılarak içerik ve kullanıcı niteliklerinin değerlendirilmesi için yazılım tasarımı, kodlaması, uygulaması ve geliştirilmesi
MELİHCAN TÜRK
Yüksek Lisans
İngilizce
2011
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİhsan Doğramacı Bilkent ÜniversitesiBilgisayar Mühendisliği Bölümü
PROF. DR. HALİL ALTAY GÜVENİR