Derin üretici ağlar ile ölçeklenebilir ikili görüntü oluşturma ve tek görüntüden üç boyutlu nesne yapılandırma

Scalable binary image generation and single image to three-dimensional object reconstruction using deep generative models

PDF İndir

Tez No: 626400
Yazar: CEREN GÜZEL TURHAN
Danışmanlar: DOÇ. DR. HASAN ŞAKİR BİLGE
Tez Türü: Doktora
Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
Anahtar Kelimeler: Belirtilmemiş.
Yıl: 2020
Dil: Türkçe
Üniversite: Gazi Üniversitesi
Enstitü: Fen Bilimleri Enstitüsü
Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
Bilim Dalı: Belirtilmemiş.
Sayfa Sayısı: 149

Özet

Derin ağ konusunda son gelişmeler, görüntü oluşturma, tamamlama, sahne değiştirme gibi bilgisayar görü problemleri için Üretici Çekişmeli Ağ (GAN) ve Otokodlayıcıya (AE) dayalı modellerin ortaya çıkmasına neden olmuştur. Bu modeller incelendiğinde daha kısa süren eğitim süreleri ve maliyetleri nedeniyle genellikle düşük boyutlu görüntüler oluşturabildiği değerlendirilmiştir. Bu nedenle, ölçeklenebilir bir üretici ağ modeli oluşturmak öncelikli olarak hedeflenmiştir. Diğer bir taraftan, üretici modellerin görüntü oluşturma performanslarından etkilenilerek bu modelleri üç boyutlu alana aktarmaya odaklanılmıştır. Gerçek problemler için daha kritik olan görüntülerden nesne oluşturma ve yeniden yapılandırma problemi ele alınmıştır. Gerçek nesnelerin üç boyutlu yer gerçekliği verilerinin elde edilmesinin güçlüğü nedeniyle sentetik veriler üzerinde eğitilen modelleri gerçek veriler üzerinde de kullanabilmek üzere RGB görüntüler yerine silüet tabanlı çalışmalar yürütülmüştür. Nesnelerin birden fazla açıdan çekilmiş görüntülerinin her zaman mevcut olamaması nedeniyle ise tek açıdan görüntülere dayalı kategori-bağımsız modeller benimsenmiştir. Tez kapsamında, ilk olarak, VAE/CPGAN ölçeklenebilir bir üretici ağ modeli oluşturmak üzere önerilmiştir. Önerilen model ile ikili görüntülerde istenen boyutlarda görüntülerin, düşük boyutlu görüntülerden elde edilebildiği görülmüştür. Tez kapsamında devam eden çalışmalarda tek açıdan görüntülerden nesne yapılandırmak üzere önerilen VoxCAE/GAN, VoxAE, VoxCAE, SkipVoxCAE ve FusedVoxCAE modelleri, literatürdeki diğer çalışmalardan farklı olarak, türevlenebilir olarak tanımlanan Bileşim üzerinde Kesişim (IoU) maliyetine dayalı olarak eğitilmiştir. Literatürde daha önce nesne yapılandırma için kullanılan amaç fonksiyonları ile analiz çalışmaları yürütülmüştür. Gerçekleştirilen niteliksel ve niceliksel değerlendirmelere göre, tez kapsamında önerilen IoU maliyetine dayalı eğitilen modellerin daha iyi performans sergilediği görülmüştür. Adım adım iyileştirilen modeller ile önde gelen çalışmalara benzer, bazı kategoriler için ise daha iyi sonuçların elde edilebildiği ortaya koyulmuştur.

Özet (Çeviri)

Recent improvements on deep generative models have revealed Generative Adversarial Network (GAN) and Autoencoder (AE) based models for image generation, completion, inpainting, and similar computer vision tasks. These models are capable of generating low-dimensional images due to the computational costs. Therefore, it has been addressed to develop a scalable GAN model. Furthermore, the performance of the current generative models has led to studies on transferring these models to three dimensional domain. Image to object reconstruction problem has been considered to be more critical for real-world problems. Differences among synthetic and real images have caused silhouette based studies rather than RGB. The category-agnostic modeling using single image has been targeted in the rest of studies due to the difficulties on obtaining multiple images of an object. In the thesis study, first of all, VAE/CPGAN has been proposed as a scalable generative model. It has been seen the desired sized images can be generated from low-dimensional images. In the following studies of thesis, proposed VoxCAE/GAN, VoxAE, VoxCAE, SkipVoxCAE and FusedVoxCAE models have been trained depending on given differentiable the Intersection-Over-Union (IoU) objective unlike previous studies in the literature. The contribution of given objective on the model performance has been analyzed comparing existing objectives for three dimensional object reconstruction. According to given qualitative and quantitative results, it has been shown that proposed models based on IoU objective can perform better than compared objectives. By improving the performances of presented models step by step, promising results have been recorded when comparing the outstanding studies.

Benzer Tezler

Tez No
964929
Anomaly detection in ınternet of medical things using deep learning
Anomaly detect ionin internet of medical things using deep learning
AYŞE BETÜL BÜKEN
Yüksek Lisans
İngilizce
2025
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol Sakarya Üniversitesi
Yazılım Mühendisliği Ana Bilim Dalı
PROF. DR. DEVRİM AKGÜN
Tez No
902017
Deepfake image/video detection and classifications using deep learning techniques
Derin öğrenme teknikleri kullanılarak deepfake görüntü/video tespiti ve sınıflandırmaları
DEO RUTIKANGA
Yüksek Lisans
İngilizce
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol Türk Hava Kurumu Üniversitesi
Elektrik ve Bilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. ZEYNEL DEPREM
Tez No
942802
Forecasting of produced output electricity in photovoltaic power plants
Foto-voltaik güç santrallarında elektrik üretim tahmini
TARANEH SAADATI
Doktora
İngilizce
2025
Enerji İstanbul Teknik Üniversitesi
Enerji Bilim ve Teknoloji Ana Bilim Dalı
DOÇ. DR. BURAK BARUTÇU
Tez No
890585
Derin üretici modeller ile polifonik müzikal içerik üretimi
Generating polyphonic musical content with deep generative models
AHMET KAŞİF
Doktora
Türkçe
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol İstanbul Üniversitesi-Cerrahpaşa
Bilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. SELÇUK SEVGEN
Tez No
893058
Semantik derin öğrenme kullanılarak nesnelerin kategorize edilmesi ve sınıflandırılması
Categorization and classification of objects using semantic deep learning
EMRE AKDEMİR
Doktora
Türkçe
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol Gazi Üniversitesi
Bilgisayar Bilimleri Ana Bilim Dalı
PROF. DR. NECAATTİN BARIŞÇI

Geri Dön