View dependent coding of 3D scenes

3 boyutlu sahnelerin bakış noktasına bağımlı kodlanması

PDF İndir

Tez No: 349899
Yazar: MUZAFFER EGE ALPER
Danışmanlar: YRD. DOÇ. DR. ULUĞ BAYAZIT
Tez Türü: Yüksek Lisans
Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, İstatistik, Computer Engineering and Computer Science and Control, Statistics
Anahtar Kelimeler: Belirtilmemiş.
Yıl: 2012
Dil: İngilizce
Üniversite: İstanbul Teknik Üniversitesi
Enstitü: Fen Bilimleri Enstitüsü
Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
Bilim Dalı: Belirtilmemiş.
Sayfa Sayısı: 81

Özet

Günümüzde bilgisayar grafik teknolojileri giderek yaygınlaşmaktadıtır. Bu teknolojiler üretimden, eğlenceye ve sağlığa kadar farklı alanlarda uygulama olanağı bulmuşlardır. Ancak giderek çoğalan veri sayısı, bu verilerin etkin kodlanmasını zorunlu kılmaktadır. Bilgisayar grafiği teknolojileri arasında çokgen tabanlı, 3 boyutlu yüzey modelleri, matematiksel basitlikleri ve temsil kolaylığı gibi nedenlerle en sık kullanılan araçlardandır. 3 Boyutlu bilgisayar grafikleri teknolojileri sayesinde bir nesnenin birden fazla bak{\i}\c{s} a\c{c}{\i}s{\i} alt{\i}nda g\“or\”ulebilmesi m\“umk\”un olmu\c{s}tur.Herhangi bir veri sıkıştırma yöntemi, verideki istatistiksel ilişkileri ve izleyicinin görsel algılama özelliklerini değerlendirmelidir. Günümüzde veri sıkıştırmanın istatistiksel doğası oldukça iyi anlaşılmış durumdadır ve bu bilgi yeni ve daha güçlü veri sıkıştırma yöntemleri için kullanılmaktadır. Ancak izleyicilerin görsel algılama özelliklerine dayalı çalışmalar nispeten daha seyrektir ve karmaşıklık kaygıları nedeniyle daha az uygulama bulmaktadır. Ancak kesin sonuçlar yerine, yaklaşıklıklar kullanıldığında, bu karmaşıklık sorununu gidermek mümkündür.3 boyutlu nesneleri temsil etmek için çeşitli yöntemler geliştirilmiştir. Bunlar genel olarak 2 grupta incelenebilir: hacim tabanlı (voxel) olanlar ve yüzey tabanlı olanlar. Yüzey tabanlı nesne temsili, opak nesnelerin sadece dışının görüleceği, dolayısıyla sadece nesnenin dışının çizilmesinin yeterli olduğu fikrine dayanır. Yarı-opak nesneler de çeşitli yaklaşımlar ile bu şekilde modellenebilir. Bu temsil biçimi, özellikle eğlence, eğitim ve prototip geliştirme uygulamalarında yaygın olarak kullanılmaktadır. Çokgen tabanlı modeller arasında, üçgen modeller, basitlikleri ve düzlemselliği garanti etmeleri sebebi ile en sık kullanılır. Bu çalışmada da üçgen tabanlı yüzey modelleri esas alınmıştır.En genel haliyle, 3 boyutlu bir görüntü, herhangi bir bakış noktasından incelenebilir. Bu nedenle, do\u{g}al olarak, \c{c}o\u{g}u veri s{\i}k{\i}\c{s}t{\i}rma metodu bak{\i}\c{s} a\c{c}{\i}s{\i}ndan ba\u{g}{\i}ms{\i}z olarak kaliteyi değerlendirerek eniyileme yapar. Bu en iyileme için genellikle, 3 boyutlu uzaydaki karesel hata kullanılır. Karesel hata basit bir bozunum ölçütüdür, ancak buna rağmen görülen bozunumu belirli bir başarıyla yansıtır. Bu çalışmada da bazı yerlerde karesel hata ölçütünden yararlanılmıştır.Bir nesnenin belirli bak{\i}\c{s} noktalarından g\“or\”ulebilece\u{g}i durumlar da d\“u\c{s}\”un\“ulebilir. Arkaplandaki nesneler ve kamera ile ayn{\i} h{\i}z ve do\u{g}rultuda hareket eden nesneler buna \”ornektir. Bu nesnelerin 3 boyutlu kodlanmas{\i} belirli bak{\i}\c{s} noktalarından izlenmekten çok (bunun için doğrudan 2 boyutlu resmi de kullanılabilir), farkl{\i} ayd{\i}nlatma ko\c{s}ullar{\i}nda ve farkl{\i} nesnelerle ili\c{s}ki i\c{c}inde görselleştirmeye hizmet etmektedir. Bu durumda sıkıştırma yönteminde bakış noktasına uygun eniyileme yapılabilir. Örneğin uzakta olan nesneler daha kaba bir şekilde kodlanırken, yakındaki nesneler daha ayrıntılı ele alınarak basit bir ``hız ataması'' sağlanabilir.3 Boyutlu bir sahnede, tel file modelleri s{\i}k{\i}\c{s}t{\i}rmadan \“once ele al{\i}nmas{\i} gereken baz{\i} temel \”on i\c{s}lemler vard{\i}r. Bunlardan en \“onemlisi, sahnede g\”or\“unmeyen y\”uzlerin ve d\“u\u{g}\”umlerin at{\i}lmas{\i}d{\i}r. Bu i\c{s}lem sayesinde, bit b\“ut\c{c}esi sadece g\”or\“unen y\”uzeyler i\c{c}in harcanm{\i}\c{s} olacakt{\i}r. G\“or\”unmeyen y\“uzlerin at{\i}lmas{\i} i\c{c}in, bu Tez'de, h{\i}zl{\i} bir {\i}\c{s}{\i}n-\”u\c{c}gen kesi\c{s}imi algoritmas{\i} kullan{\i}lm{\i}\c{s}t{\i}r. Burada her bir düğüme, izleyicinin bakış noktasından bir ışın gönderilir. Bu ışının kestiği en yakın üçgenin, ilgili düğüme komşu olmaması durumunda, o düğüm görünmez olarak işaretlenir. Bir yüzün (çokgen), tüm köşelerinin görünmez olması durumunda o yüz sahneden atılır. Her bir kesi\c{s}im i\c{s}leminin h{\i}zl{\i} olmas{\i}, i\c{s}lem say{\i}s{\i}n{\i}n d\“u\u{g}\”um say{\i}s{\i}na karesel olarak ba\u{g}l{\i} olmas{\i} nedeniyle, toplam i\c{s}lemin k{\i}sa olmas{\i}nı gerektirmez. Özg\“un tel file modeller \”uzerinde \c{c}al{\i}\c{s}an g\“or\”unmeyen y\“uzlerin at{\i}lmas{\i} i\c{s}leminin olduk\c{c}a pahal{\i} olmas{\i} nedeniyle, bu Tez'de tel file modelin uygun bir parametrikle\c{s}tirilmesi yoluyla i\c{s}lemi h{\i}zland{\i}ran yeni bir y\”ontem \“onerilmektedir. Burada, açı koruyan bir parametrikleştirme işlemi yardımıyla, ilgili tel file model, daha basit bir tel file model üzerinde parametrik olarak temsil edilir. Böylece bu basit model üzerinde yapılan görünmeyen yüzlerin atılması işlemi sonuçları tekrar (ters fonksiyon aracılığıyla) özgün modele taşınır. A\c{c}{\i} koruyan parametrikle\c{s}tirme i\c{s}lemi sayesinde, \%95'e varan h{\i}z kazanımları g\”ozlemlenmi\c{s}tir. {. I}\c{s}lemin yakla\c{s}{\i}k bir sonu\c{c} vermesi nedeniyle olu\c{s}an hatan{\i}n ise k\“u\c{c}\”uk oldu\u{g}u g\“ozlemlenmi\c{s}tir. Önerilen yöntem, başarım eğrisinde farklı süre-başarım noktaları seçilmesine olanak vermektedir, böylece ihtiyaca göre süre ve başarım performansı ayarlanabilir.Bir\c{c}ok nesnenin bulundu\u{g}u bir sahnenin s{\i}k{\i}\c{s}t{\i}r{\i}lmas{\i} s{\i}ras{\i}nda gerekli bir ba\c{s}ka \”on i\c{s}lem ise sahnenin b\“olgelere ayr{\i}lmas{\i}d{\i}r. Bu i\c{s}lem kodlay{\i}c{\i} karma\c{s}{\i}kl{\i}\u{g}{\i}n{\i} d\”u\c{s}\“ur\”ur ve video kodlamadaki bloklara ay{\i}rma i\c{s}lemine benzetilebilir. Bu i\c{s}lemle birlikte hangi b\“olgenin, toplam bit b\”ut\c{c}esinden ne kadar bit kullanacağı sorusu hız ataması probleminin daha genel bir hali olarak ortaya çıkar. {. I}zleyici konumuna ba\u{g}l{\i} kodlamada ise bu \c{c}ok daha \“onemli bir sorun olur, çünkü bu durumda sahnedeki bölgeler arasındaki algılanabilirlik farkları büyümüştür. Literat\”urde \“onerilen \c{c}e\c{s}itli y\”ontemler bu sorunsala farkl{\i} \c{c}\“oz\”umler getirir. Ancak bu y\“ontemler ya k{\i}s{\i}tl{\i} ko\c{s}ullar alt{\i}nda optimaldir, ya da sezgisel y\”ontemlerdir ve hangi ko\c{s}ullarda optimal olduklar{\i}ndan bahsedilmez. Farkl{\i} görselleştirme ko\c{s}ullar{\i}nda eniyi sonucu verecek genel bir y\“ontem eksiktir. Bu nedenle, bu Tez'de \c{s}u temel soruya cevap aranmaktad{\i}r: ”hem \c{c}ok \c{c}e\c{s}itli ko\c{s}ullarda eniyi olan hem de kaynak kullan{\i}m{\i} a\c{c}{\i}s{\i}ndan ger\c{c}ek\c{c}i s{\i}n{\i}rlarda olan bir y\“ontem m\”umk\“un m\”ud\“ur?”.Literat\“urde daha \”once \“onerilen ve bu \c{c}al{\i}\c{s}mada incelenen y\”ontemler aras{\i}nda, ``ekran uzay{\i}''ndaki bozunumlar{\i} eniyileyen, en fazla g\“or\”unen k{\i}s{\i}mlar{\i}n 3 Boyutlu karesel hatalar{\i}n{\i} eniyileyen, izleyiciye en yak{\i}n olan k{\i}s{\i}mlar{\i}n 3 Boyutlu karesel hatalar{\i}n{\i} eniyileyen y\“ontemler vard{\i}r. Tez i\c{c}inde, bu y\”ontemlerin h{\i}z ve ba\c{s}ar{\i}mlar{\i} kar\c{s}{\i}la\c{s}t{\i}r{\i}lm{\i}\c{s}, \“ust\”un ve eksik yanlar{\i} g\“osterilmi\c{s}tir. Yukar{\i}da belirtilen sorunun cevab{\i}na varmak i\c{c}in, \”oncelikle literatürdeki y\“ontemler ile bu \c{c}al{\i}\c{s}mada ilk olarak \”onerilen ve hesaplama karma\c{s}{\i}kl{\i}\u{g}{\i} y\“uksek imge tabanl{\i} y\”ontem kar\c{s}{\i}la\c{s}t{\i}r{\i}lm{\i}\c{s}t{\i}r. Literatürdeki baz{\i} y\“ontemlerin olduk\c{c}a h{\i}zl{\i} olabildi\u{g}i g\”ozlemlenirken, \“onerilen y\”ontem ile arada ba\c{s}ar{\i}m fark{\i}n{\i}n bulundu\u{g}u g\"osterilmi\c{s}tir.Bu gözlemler üzerine, hesaplama karmaşıklığı açısından diğer yöntemlerle rekabet edebilecek ama başarım açısından imge tabanlı yönteme yakın bir yöntem tasarlanmıştır. Bu yeni yöntem için en temel gözlem, uzaklık tabanlı hız atama yönteminin oldukça düşük bir hesaplama karmaşıklığı ve yüksek çalışma hızı ile görüntü tabanlı yöntemin sonucuna oldukça yaklaşabilmesidir. Uzaklık tabanlı hız atama yönteminin vardığı çözüm başlangıç noktası kabul edilerek, adım adım, görüntü tabanlı bozunum ölçütüne göre daha iyi sonuçlar elde eden karma bir yöntem önerilmektedir. Yapılan deneyler sonucunda önerilen yöntemin, literatürdeki diğer yöntemlerden üstün olduğu gözlemlenmiştir. Ekte ise yöntemin hangi koşullar altında eniyi sonucu vereceği kuramsal olarak tartışılmıştır.

Özet (Çeviri)

3 dimensional graphics technology allows one to examine a visual object in manyangles. Thus, naturally, many compression methods are optimized without consideringthe viewpoint and direction of the observer. However, there are many applicationsin which one can imagine objects in a scene are only examined from particularviewpoints. Background objects and objects that move synchronously with the cameraare examples of this scenerio. In this case there is a lot more room for compression,due to not only excluding the invisible parts from the coding process but also thepsycho-visual properties of the objects.There have been several methods proposed to exploit these properties and compressthe meshes even further. However, these methods are either optimal in very strictconditions or heuristic in nature. Thus, a general purpose method, that would beoptimal under various conditions, is lacking. Consequently, the main question to beanswered in this Thesis work is“is there a method that would optimize the compressiondirectly for the final image while still being computationally practical ?”.The road to the answer contains discussion and comparison of the previously proposedmethods and a novel rendering based method that is optimal for the final image. Thisoptimality comes at a high cost in terms of computational resources. The balanceis achieved by a hybrid method that initially computes an approximate solution ina very fast manner and then refines this solution via the slower but more optimalmethod. We show that such a method significantly improves the viewpoint dependentcompression performance, surpassing the proposed methods in the literature, whilebeing fast enough for practical applications.

Benzer Tezler

Tez No
402041
Reduced-complexity disparity estimation for efficient multiview imagery encoding
Başlık çevirisi yok
AYKUT AVCI
Doktora
İngilizce
2013
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol Ghent University
PROF. DR. HERBERT DE SMET
DR. JAN DE COCK
Tez No
353689
View-dependent coding of animated mesh sequences
Canlandırılmış göz dizilerinin bakış noktası bağımlı kodlanması
SEMİH ÇELİK
Yüksek Lisans
İngilizce
2014
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol İstanbul Teknik Üniversitesi
Bilgisayar Bilimleri Ana Bilim Dalı
PROF. DR. ULUĞ BAYAZIT
Tez No
864852
Kamusal açık alanlarda değişen mikro iklim koşulları ve dış mekân termal konfor: Taksim Meydanı ve Gezi Parkı örnekleri
Changing microclimatic conditions and outdoor thermal comfort in public open spaces: Examples of Taksim Square and gezi park
EDA HAFIZOĞLU
Yüksek Lisans
Türkçe
2024
Meteoroloji İstanbul Teknik Üniversitesi
Kentsel Tasarım Ana Bilim Dalı
DOÇ. DR. GÜLDEN DEMET ORUÇ ERTEKİN
Tez No
693121
Zayıf jeolojik ortamlarda (İstanbul metrosu) sığ ve çoklu yeraltı açıklıklarının neden olduğu yüzey deformasyonlarının kestirilmesi
Prediction of the surface deformations induced by shallow and multiple underground excavations (Istanbul subway) in weak geological environments
CANDAŞ TOPAL
Doktora
Türkçe
2021
Jeoloji Mühendisliği İstanbul Teknik Üniversitesi
Jeoloji Mühendisliği Ana Bilim Dalı
DOÇ. DR. YILMAZ MAHMUTOĞLU
Tez No
559423
İnsan hareketi izleme teknolojilerinin karşılaştırmalı değerlendirmesi
Comparative assessment of human motion monitoring technologies
CEMAL FATİH KUYUCU
Yüksek Lisans
Türkçe
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol İstanbul Teknik Üniversitesi
Bilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ GÖKHAN İNCE

Geri Dön