Volume estimation of known objects from single images using depth and segmentation
Derinlik ve segmentasyon kullanarak tek görüntülerden bilinen nesnelerin hacim tahmini
- Tez No: 851053
- Danışmanlar: DR. ÖĞR. ÜYESİ TARKAN AYDIN
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2023
- Dil: İngilizce
- Üniversite: Bahçeşehir Üniversitesi
- Enstitü: Lisansüstü Eğitim Enstitüsü
- Ana Bilim Dalı: Yapay Zeka Ana Bilim Dalı
- Bilim Dalı: Yapay Zeka Bilim Dalı
- Sayfa Sayısı: 92
Özet
Bu tez, bilinen nesnelerin hacmini tek bir görüntü perspektifinden tahmin etme gibi zorlu bir görevi ele almaktadır. Bu tezde, tek bir görüntüden nesnelerin hacmini tahmin etmek için yeni bir model önerdik. Son teknoloji derin öğrenme metodolojilerinden yararlanılarak görüntü, derinlik ve segmentasyon ağlarını içeren kapsamlı bir analize tabi tutulmaktadır. Derinlik ağı nesnenin derinlik haritasını tahmin etmekten sorumluyken, segmentasyon ağı görüntü içindeki nesnelerin pozunu belirler. Bu çıktıların kameranın içsel verileriyle birleştirilmesi, ayrıntılı bir nokta bulutunun oluşturulmasıyla sonuçlanır. Bu nokta bulutu, hassas hacim tahmini için temel veri kaynağı görevi görerek bilgisayarla görme alanındaki ilerlemelere katkıda bulunur. Halka açık veri kümeleri üzerinde yapılan deneyler, yöntemimizin diğer yöntemlerden daha iyi performans gösterdiğini ve en son teknoloji ürünü performansa ulaştığını göstermektedir.
Özet (Çeviri)
This thesis delves into the challenging task of estimating the volume of known objects from a single-view image perspective. In this thesis, we proposed a new model for estimating the volume of objects from just one image. Leveraging state-of-the-art deep learning methodologies, the image undergoes a comprehensive analysis involving depth and segmentation networks. The depth network is responsible for estimating the object's depth map, while the segmentation network determines the pose of the objects within the image. Combining these outputs with the intrinsic data of the camera results in the creation of a detailed point cloud. This point cloud serves as the foundational data source for precise volume estimation, contributing to advancements in the field of computer vision. The experiments on publicly available datasets show that our method outperforms the other methods and achieves the state-of-the-art performance.
Benzer Tezler
- Enerji korunumlu yapıların yönlendirilmesi ve biçimlendirilmesi için yeni bir metod
A New method for the orientation and design of a building of minimal energy consumption
AYŞE ELAGÖZ
- Güç transformatörlerinin optimum tasarımına yönelik çalışmaların incelenmesi
Başlık çevirisi yok
LEVENT CAN
Yüksek Lisans
Türkçe
1998
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiElektrik Mühendisliği Ana Bilim Dalı
PROF. DR. NURDAN GÜZELBEYOĞLU
- Sayısal arazi modeli ve batimetrik verilerin kıyı bilgi sistemine entegrasyonu
Başlık çevirisi yok
CİHANGİR AYDÖNER
Yüksek Lisans
Türkçe
1998
Jeodezi ve Fotogrametriİstanbul Teknik ÜniversitesiUzaktan Algılama Ana Bilim Dalı
PROF. DR. DERYA MAKTAV
- Kapalı alan konum belirlemede RFID ve UWB teknolojilerinin performans karşılaştırılması
The performance comparison of RFID and UWB technologies in indoor positioning
ÖMER FARUK BAĞDATLI
Yüksek Lisans
Türkçe
2024
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
PROF. DR. ÖZGÜR ÖZDEMİR