A novel scalable global alignment method for 3D reconstruction
Üç boyutlu yeniden yapılandırma için yeni bir ölçeklenebilir küresel hizalama yöntemi
- Tez No: 940764
- Danışmanlar: DOÇ. DR. EROL ŞAHİN, DOÇ. DR. EMRE AKBAŞ
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2025
- Dil: İngilizce
- Üniversite: Orta Doğu Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 82
Özet
Üç boyutlu görüntülemenin temel zorluklarından birisi kamera parametrelerinin ve sahnenin 3 boyutlu geometrisinin tahmin edilmesidir. Geleneksel olarak, bu görev kendini zaman içinde kanıtlamış Hareketten Yapı Çıkartımı gibi yöntemlerle çözülmüştür. Bu yöntemlerde, ana görev alt görevlere bölünür ve bir dizi algoritma modüllerinden oluşan işlem hatları aracılığıyla ele alınır. Ancak, her bir alt görev kendi içinde çözüldüğü için ve modüller arasındaki iletişim kısıtlı olduğu için bu yöntemler işlem sırasında oluşabilecek hatalara ve oluşan gürültüye karşı zayıf kalabilmekte ve bu gürültü işlem hatlarında sonraki modülleri de etkilemektedir. Her ne kadar son yıllarda ortaya çıkan çalışmalarla işlem hatlarının performanslarını ve gürbüzlüklerini artırılsa da, işlem hatlarının doğası gereği bu problem hala devam etmektedir. DUSt3R adı verilen yeni bütünsel bir yöntem, görsel çiftleri üzerinde çalışmakta ve bu görsellerden ``nokta haritaları'' adlı bilgi açısından zengin yapılar çıkarmaktadır. Bu nokta haritaları kamera parametresi tespiti, nokta eşleme, 3 boyutlu yapılandırma ve derinlik tahmini gibi problemlerde kullanılabilmektedir. Çok sayıda görüntüyü işlemek için DUSt3R bir küresel hizalama yöntemi kullanarak verisetindeki görselleri çiftler halinde işleyip sonra bir optimizasyon algoritması ile nokta haritalarını ortak bir koordinat sistemine yerleştirmektedir. Ancak, önerilen hizalama yöntemi karesel hesaplama karmaşıklığına sahiptir. Bu tezde, orijinal küresel hizalama yönteminin $O(N^2)$ karmaşıklığını $O(km^2)$ gibi teorik bir sınıra indirgeyen, yeni ve ölçeklenebilir bir küresel hizalama yöntemi öneriyoruz. Burada $m \ll N$ önceden belirlenmiş bir görsel kümesi büyüklüğünü, $k=N/m$ ise görsel kümelerinin sayısını ifade etmektedir. Hesaplama karmaşıklığındaki bu iyileştirme, DUSt3R tabanlı modellerin modern, genel amaçlı bir 3 boyutlu görü sistem aracı olarak benimsenmesini hızlandırma potansiyeline sahiptir. Sonuçlarımız, önerdiğimiz yöntemin bellek ve zaman karmaşıklığında, teorik üst sınırımızla uyumlu olarak önemli bir azalma gösterdiğini ortaya koymaktadır. Öte yandan, Bağıl Konum Doğruluğu ve Bağıl Dönme Doğruluğu ölçütleri, önerdiğimiz yöntemin DUSt3R ve türevleriyle karşılaştırılabilir bir performans sergilediğini göstermektedir.
Özet (Çeviri)
One of the core challenges in 3D Vision is the estimation of 3D scene geometry. Traditionally, this task was predominantly tackled with well-established and time-tested methods such as Structure-from-Motion, a pipeline of simpler algorithms where each algorithm handles a specific subtask. However, this makes the overall pipeline susceptible to errors and noise, which propagate to subsequent modules. Although recent work has improved the accuracy of such pipelines, the aforementioned problems persist. DUSt3R, a recent holistic method to address this issue, takes a pair of images as input and extracts information-rich structures called ``pointmaps''. These pointmaps can then be used in downstream tasks, such as camera parameter estimation, point matching, 3D reconstruction, and depth estimation. To handle multiple images, DUSt3R employs a global alignment method that processes the images in pairs and applies an optimization algorithm to place the pointmaps in a common coordinate frame. However, the proposed alignment method suffers from a quadratic computational complexity. In this thesis, we propose a novel, scalable global alignment method that reduces the original $O(N^2)$ complexity to a theoretical upper bound of $O(km^2)$, where $m \ll N$ is a predetermined batch size and $k=N/m$ is the number of batches. This relaxation of computational complexity can accelerate the adoption of DUSt3R-based methods as a modern general-purpose 3D Vision tool. Our results show that our method demonstrates a substantial decrease in memory and time complexity, consistent with our theoretical upper bound; additionally, Relative Translation Accuracy (RTA) and Relative Rotation Accuracy (RRA) metrics show that our method performs comparable to DUSt3R and its variants.
Benzer Tezler
- Miras alanlarının korunmasında sorumlu turizm ve paydaş ağı ilişkisi: Kemaliye örneği
The connection between responsible tourism and stakeholder networks in the protection of heritage sites: The case of Kemaliye
BÜŞRA YALÇIN
Doktora
Türkçe
2025
Şehircilik ve Bölge Planlamaİstanbul Teknik ÜniversitesiŞehir ve Bölge Planlama Ana Bilim Dalı
PROF. DR. TURGAY KEREM KORAMAZ
- Blockchain-based caller-id authentication (BBCA): A novel solution to prevent spoofing attacks in VOIP/SIP networks with an analysis of spoofing attack anatomy and test results
Blok zinciri tabanlı arayan kimliği doğrulaması (BBCA): VOIP/SIP ağlarında arayan kimliği sahtekarlığı saldırılarını önlemek için yeni bir çözüm ile arayan kimliği sahtekarlığı saldırı anatomisi ve test sonuçlarının analizi
İSMAİL MELİH TAŞ
Doktora
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBahçeşehir ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ SELÇUK BAKTIR
- Evaluation of vaccine antigenicity potential of extracellular vesicles isolated from Leishmania spp.
Leishmania türlerinden izole edilen hücre dışı keseciklerin aşı antijenisite potansiyelinin değerlendirilmesi
İBRAHİM TOKMAK
Yüksek Lisans
İngilizce
2025
Allerji ve İmmünolojiDokuz Eylül ÜniversitesiMoleküler Biyoloji ve Genetik Ana Bilim Dalı
PROF. DR. GÖKHAN KARAKÜLAH
- Enhancement of lung cancer hıstopathologıcal ımage classıfıcatıon usıng K-fold cross valıdatıon and vahanade-based dıgıtal ımage processıng pıpelıne
Akciğer kanseri histopatolojik görüntü sınıflandırmasının K-kat çapraz doğrulama ve vahanade tabanlı dijital görüntü işleme hattı kullanılarak geliştirilmesi
MEHMET ÇAĞLAR VESEK
Yüksek Lisans
İngilizce
2025
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAtılım ÜniversitesiYazılım Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ERHAN GÖKÇAY
- Siting and sizing of renewable energy supported electric vehicle charging stations along highways with a novel interoperable smart energy management system
Yenilenebilir enerji destekli elektrikli araç şarj istasyonlarının otoyollar boyunca konumlandırılması ve boyutlandırılmasına yönelik yeni birlikte çalışabilir akıllı enerji yönetim sistemi
ÖMER GÖNÜL
Doktora
İngilizce
2025
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiEnerji Bilim ve Teknoloji Ana Bilim Dalı
PROF. DR. ÖNDER GÜLER