3D shape generation and manipulation

3 boyutlu model jenerasyonu ve manipülasyonu

PDF İndir

Tez No: 765001
Yazar: ALARA DİRİK
Danışmanlar: DOÇ. DR. EMRE UĞUR, DR. PINAR YANARDAĞ
Tez Türü: Yüksek Lisans
Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
Anahtar Kelimeler: Belirtilmemiş.
Yıl: 2022
Dil: İngilizce
Üniversite: Boğaziçi Üniversitesi
Enstitü: Fen Bilimleri Enstitüsü
Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
Bilim Dalı: Belirtilmemiş.
Sayfa Sayısı: 61

Özet

Bilgisayar grafikleri, 3B bilgisayarlı görü ve robotik komüniteleri 3B şekilleri ifade etmek, modellemek ve jenere etmek için pek çok yöntem geliştirmiş ve kullanım alanı oluşturmuştur. Bu kullanım alanlarının bazıları 3B şekilleri kodlama ve sıkıştırma ve kısmi 3B şekillerin tamamlanması olup; 3B şekil manipülasyonu ve tek resimden 3B şekil üretme hala görece az çalışılmış konulardır. 3B şekil manipülasyonu ve tek resimden 3B şekil üretme konuları birbirleriyle ilişkili olup, bu konular üzerindeki çalışmalar yeni dizayn metodolojilerini mümkün kılacaktır. Bu tezde 3B şekil manüpülasyonu için bir çerçeve geliştirip, baz model olarak Deep Implicit Templates'i kullandık. Bu model 3B şekil üretmenin haricinde, aynı kategoriye ait şekiller için topolojik benzerlik haritaları çıkarabilmektedir. Bunun için öncelikle 3B şekil temsil formatlarını ve ilgili araştırmaları anlatmakla başlayıp, daha sonra geliştirdiğimiz metodları ve çerçeveyi anlattık. Tezimizde ana veriseti olarak ShapeNetV2'yi kullanarak Deep Implicit Templates katmanları içinde denetimli ve denetimsiz yönler bulduk. Deneylerimiz sonucunda, PCA uygulayarak bulduğumuz denetimsiz yönlerin pek çok lokal ve global özelliği temsil ettiğini gördük: sandalye yüksekliği, araba uzunluğu, dizayn trendleri ve şekil alt kategorileri gibi. Ek olarak, ShapeNetV2 meta verisini ve öğrenilmiş şekil kodlarını kullanarak eğitilmiş lineer SVM modelleriyle başarılı şekilde denetimli manipülasyon yapabileceğimizi gösterdik. Son olarak, eğitilmiş bir Vision Transformer (ViT) modelinin ve eğitilmiş bir birleşik resim-yazı temsili modeli olan, CLIP'in ara katmanlarını kullanarak gerçek zamanlı ve efektif bir tek resimden 3B şekil üretme metodu geliştirdik. Geliştirdiğimiz metod, ViT ve CLIP'in ara katmanlarıyla DIT'in ara katmanları arasında köprü görevi görmekte olup, poz ve perspektiften bağımsız olarak gerçek zamanlı ve yüksek kalitede resimleri 3B şekillere dönüştürebilmektedir.

Özet (Çeviri)

Computer graphics, 3D computer vision and robotics communities have produced multiple approaches to represent and generate 3D shapes, as well as a vast number of use cases. These use cases include, but are not limited to, data encoding and compression, shape completion and reconstruction from partial 3D views. However, controllable 3D shape generation and single-view reconstruction remain relatively unexplored topics that are tightly intertwined and can unlock new design approaches. In this work, we propose a unified 3D shape manipulation and single-view reconstruction framework that builds upon Deep Implicit Templates, a 3D generative model that can also generate correspondence heat maps for a set of 3D shapes belonging to the same category. For this purpose, we start by providing a comprehensive overview of 3D shape representations and related work, and then describe our framework and proposed methods. Our framework uses ShapeNetV2 as the core dataset and enables finding both unsupervised and supervised directions within Deep Implicit Templates. More specifically, we use PCA to find unsupervised directions within Deep Implicit Templates, which are shown to encode a variety of local and global changes across each shape category. In addition, we use the latent codes of encoded shapes and metadata of the ShapeNet dataset to train linear SVMs and perform supervised manipulation of 3D shapes. Finally, we propose a novel framework that leverages the intermediate latent spaces of Vision Transformer (ViT) and a joint image-text representational model, CLIP, for fast and efficient Single View Reconstruction (SVR). More specifically, we propose a novel mapping network architecture that learns a mapping between the latent spaces ViT and CLIP, and DIT. Our results show that our method is both view-agnostic and enables high-quality and real-time SVR.

Benzer Tezler

Tez No
439525
Formalizing making in design
Tasarımda yapma eyleminin formalizasyonu
BENAY GÜRSOY TOYKOÇ
Doktora
İngilizce
2016
Endüstri Ürünleri Tasarımı İstanbul Teknik Üniversitesi
Bilişim Ana Bilim Dalı
PROF. DR. MİNE ÖZKAR KABAKÇIOĞLU
Tez No
338484
Detection of imatinib and doxorubicin resistance in K562 leukemia cells by 3D-electrode contactless dielectrophoresis
Imatinib ve doxorubicin direnci geliştirmiş K562 lösemi hücrelerinin 3 boyutlu elektrot kullanılarak temassız dielektroforez ile tespiti
YAĞMUR DEMİRCAN
Yüksek Lisans
İngilizce
2013
Biyoloji Orta Doğu Teknik Üniversitesi
Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
DOÇ. DR. HALUK KÜLAH
Tez No
46579
Mimari bir dilin biçim grameri analizi ve bilgisayar ortamında sunumu
Başlık çevirisi yok
EDA VELİBAŞOĞLU
Yüksek Lisans
Türkçe
1995
Mimarlık İstanbul Teknik Üniversitesi
DOÇ.DR. GÜLEN ÇAĞDAŞ
Tez No
608269
Numerical and physical modeling of jarlan type breakwaters
Jarlan tipi dalgakıranların sayısal ve fiziksel modellenmesi
ÇAĞKAN GÜÇER
Yüksek Lisans
İngilizce
2019
Deniz Bilimleri Yıldız Teknik Üniversitesi
İnşaat Mühendisliği Ana Bilim Dalı
DOÇ. DR. BURAK AYDOĞAN
Tez No
439644
An investigation on growth behavior of mycelium-based material in a fabric formwork
Miselyum esaslı bir malzemenin esnek kalıp üzerindeki büyüme davranışı üzerine bir araştırma
AYSEL GÜLAY ELBASDI
Yüksek Lisans
İngilizce
2016
Mimarlık İstanbul Teknik Üniversitesi
Bilişim Ana Bilim Dalı
YRD. DOÇ. DR. SEMA ALAÇAM

Geri Dön