3 boyutlu çekişmeli üretici ağlar ile imalata hazır parça üretimi
Manufacturing-ready part generation with 3D generative adversarial networks
- Tez No: 958116
- Danışmanlar: PROF. DR. HÜSEYİN POLAT
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2025
- Dil: Türkçe
- Üniversite: Gazi Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 99
Özet
Üç boyutlu (3B) nokta bulutu üretimi, bilgisayar grafikleri, robotik ve sanal gerçeklik gibi birçok alanda kritik bir rol oynamaktadır. Ancak, mevcut Üretken Çekişmeli Ağlar (Generative Adversarial Networks, GAN) tabanlı modeller, özellikle karmaşık ve düzensiz 3B verilerde, global yapısal tutarlılık ile ince lokal geometrik ve topolojik detayların dengeli bir şekilde modellenmesinde önemli zorluklar yaşamaktadır. Bu durum, üretilen şekillerin gerçekçiliğini ve kullanılabilirliğini sınırlamaktadır. Bu tez çalışması, bu zorlukların üstesinden gelmek ve 3B nokta bulutu üretim kalitesini artırmak amacıyla, küre tabanlı başlangıç prensibini Graf Konvolüsyonel Ağların (Graph Convolutional Networks, GCN) güçlü temsil öğrenme yetenekleriyle hem üretici (Generator) hem de ayırt edici (Discriminator) ağlarda bütünleştiren SphereGCN Fusion adlı yenilikçi bir GAN mimarisi önermekte ve geliştirmektedir. Önerilen model, SP-GAN mimarisinin küresel geometriyi yakalama avantajını temel alırken, GCN katmanlarının özellikle ayırt edici ağa entegrasyonu sayesinde, üretilen nokta bulutlarının lokal bağlantılarını, topolojik bütünlüğünü ve yapısal doğruluğunu daha hassas bir şekilde denetleyerek üreticiye daha anlamlı geri bildirim sağlamayı hedefler. Model, literatürde yaygın olarak kullanılan ShapeNet veri setinin 'Sandalye' kategorisi üzerinde eğitilmiş ve performansı kapsamlı bir şekilde değerlendirilmiştir. Deneysel sonuçlar, SphereGCN Fusion'ın, temel aldığı SP-GAN ve karşılaştırılan diğer güncel yöntemlere kıyasla Minimum Eşleşme Mesafesi (MMD-CD), Kapsama (COV-CD) ve Fréchet Nokta Bulutu Mesafesi (FPD) gibi standart nicel metriklerde belirgin iyileşmeler sergilediğini göstermiştir. Ayrıca, modelin daha az sayıda öğrenilebilir parametre ile daha kısa sürede eğitilebildiği ve görsel olarak daha çeşitli, gerçekçi, pürüzsüz yüzeylere ve belirgin ince detaylara sahip, topolojik olarak daha tutarlı nokta bulutları ürettiği gözlemlenmiştir.
Özet (Çeviri)
Three-dimensional (3D) point cloud generation plays a critical role in many fields such as computer graphics, robotics, and virtual reality. However, existing Generative Adversarial Network (GAN) based models encounter significant challenges, particularly with complex and irregular 3D data, in harmoniously modeling global structural consistency with fine local geometric and topological details. This limitation often curtails the realism and usability of the generated shapes. This thesis study aims to overcome these challenges and enhance 3D point cloud generation quality by proposing and developing an innovative GAN architecture, named SphereGCN Fusion, which integrates the sphere-guided generation principle with the powerful representation learning capabilities of Graph Convolutional Networks (GCNs) in both the generator and discriminator networks. While building upon the SP-GAN architecture's advantage in capturing global geometry, the proposed model specifically leverages the integration of GCN layers into the discriminator. This allows for a more precise assessment of local connectivity, topological integrity, and structural correctness of the generated point clouds, thereby providing more meaningful feedback to the generator. The model was trained on the 'Chair' category of the widely-used ShapeNet dataset, and its performance was comprehensively evaluated. Experimental results demonstrate that SphereGCN Fusion exhibits significant improvements in standard quantitative metrics such as Minimum Matching Distance (MMD-CD), Coverage (COV-CD), and Fréchet Point Cloud Distance (FPD), when compared to its baseline SP-GAN and other contemporary methods. Furthermore, it was observed that the model can be trained with fewer learnable parameters and in a shorter duration, while producing point clouds that are visually more diverse, realistic, possess smoother surfaces with distinct fine details, and are topologically more consistent.
Benzer Tezler
- Deep 3D semantic scene extrapolation
Derin 3B semantik sahne ekstrapolasyonu
ALI ABBASI
Yüksek Lisans
İngilizce
2018
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. YUSUF SAHİLLİOĞLU
DOÇ. DR. SİNAN KALKAN
- Human activity recognition using deep learning
Derin öğrenme ile insan aktivitesi tanıma
MURAT YALÇIN
Yüksek Lisans
İngilizce
2018
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ HÜLYA YALÇIN
- Oyun karakteri üretimi için üretken modeller
Generative models for game character generation
FERDA GÜL AYDIN EMEKLİGİL
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiOyun ve Etkileşim Teknolojileri Ana Bilim Dalı
DOÇ. DR. İLKAY ÖKSÜZ
- 3D point cloud classification with GANs: ACGAN and VACWGAN-GP
3B nokta bulutunun çekişmeli sinir ağları ile sınıflandırılması: ACGAN ve VACWGAN-GP
ONUR ERGÜN
Yüksek Lisans
İngilizce
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. YUSUF SAHİLLİOĞLU
- Super-resolution of landsat-8 images using sentinel-2 images and generative adversarial networks
Sentinel-2 görüntüleri ve çekişmeli üretici ağlar kullanılarak landsat-8 görüntülerinin süper çözünürlüğü
ESRA SUNKER
Yüksek Lisans
İngilizce
2024
Jeodezi ve Fotogrametriİstanbul Teknik ÜniversitesiGeomatik Mühendisliği Ana Bilim Dalı
PROF. DR. ELİF SERTEL
PROF. DR. BÜLENT BAYRAM