Deep learning architectures for smart urban scene analysis
Akıllı kentsel sahne analizi için derin öğrenme mimarileri
- Tez No: 771049
- Danışmanlar: DR. ÖĞR. ÜYESİ İSMAİL BURAK PARLAK
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2022
- Dil: İngilizce
- Üniversite: Galatasaray Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Akıllı Sistemler Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Akıllı Sistemler Mühendisliği Bilim Dalı
- Sayfa Sayısı: 85
Özet
Akıllı şehir analizi, otonom kentsel yaşam problemlerinde öne çıkan önemli bir alan haline geliyor. Görüntü semantiği, görüntü sınıflandırmasının, semantik bölütlemenin ve nesne algılama alt programlarının, uzay-zamansal veri kümeleri aracılığıyla kademeli bir çerçevede sahnelendiği karmaşık bir problemdir. Kentsel sahne analizi, havacılık, robotik, şehir güvenliği, otonom araçlar ve toplu taşıma gibi çeşitli uygulamalarda birleştirilmiştir. Bir kentsel sahnenin temel sorunu, bir şehrin sokaklarında ayrık 2D-3D hareketlerin izlenmesi olarak karakterize edilir. Bu nedenle, sahnedeki uzamsal boşluğu en aza indirmek için sahnenin doğru bir şekilde bölümlenmesi gerekmektedir. Eksiksiz çerçeve, kentsel sahnedeki insanları ve diğer hareketli nesneleri korumak için kritik karar verme araçları sağlar. Kazaları önlemek için yeni nesil otonom sistemler, bir sokaktaki olası tüm hareketleri izlemek için gerçek zamanlı sensörlerini çalıştırmaktadır. Ancak, şehir verisi iç görülerini oluşturmak için algılama aşamasının anlamsal düzeyde yorumlanması gerekir. Semantik bölütlemenin görevi, arka plan dahil her pikseli semantik bir sınıfa etiketlemektir. Nesne algılama ise bir sınırlayıcı kutu ile nesnelerin varlığını ve görüntüde konumlanmış nesnelerin türlerini/sınıflarını bulur. Bu nedenle, nesne algılama değişmez temsilleri gerektirirken, bölütleme eş değişken gösterimleri gerektirir. Örnek bölütleme şu iki görevi içerir: nesne algılama ve semantik/anlamsal bölütleme. Bu tez, Cityscapes veri seti aracılığıyla temel nesnelerin örnek segmentasyonundan oluşmaktadır. Yüksek çözünürlüklü görüntülere YOLACT derin öğrenme mimarisi uygulanmıştır. Yöntem tek aşamalı bölütleme gerektirdiğinden hızlı bulunmuştur. Ek olarak, büyük ölçekli nesneler için maskelerin kalitesi, küçük ölçülü objelere göre daha iyidir. Tez ile, YOLACT mimarisinin, uzamsal boşlukların daha düşük olduğu doğru bir veri kümesinde uygulanabilir görüntü etiketleri oluşturduğu sonucuna varılmıştır.
Özet (Çeviri)
Smart city analysis becomes an emerging field in autonomous urban life problems. Image semantics is a complex problem where the image classification, the semantic segmentation and the object detection subroutines are staged in a cascade framework through spatio-temporal datasets. Urban scene analysis has been coupled in several applications such as aviation, robotics, city security, autonomous vehicles, and mass transport. The initial problem of an urban scene is characterized as the pursuit of discrete 2D-3D movements on the streets of a city. Therefore, an accurate segmentation of the scene is required to minimize the spatial gap in the scene. The complete framework provides critical decision-making tools to protect the human beings and the moving objects. To prevent the accidents, new generation autonomous systems turn on their real time sensors to monitor all possible movements in a street. The task of semantic segmentation is to label every pixel including the background into a semantic class. The object detection locates the presence of objects with a bounding box and types or classes of the located objects in an image. Therefore, the detection requires the invariant representations whereas the segmentation needs the equivariant representations. The instance segmentation contains these two tasks: object detection and semantic segmentation. This thesis is composed of the instance segmentation of base objects through Cityscapes dataset. YOLACT deep learning architecture has been applied on high resolution images. The method has been found fast as it requires one stage segmentation. The quality of the masks was better for the large-scale objects.
Benzer Tezler
- Çok yüksek çözünürlüklü hava fotoğraflarından derin ögrenme yöntemi ile bina bölütlemesi
Building segmentation from very high resolution aerial imagery using deep learning
NURAN ASLANTAŞ
Yüksek Lisans
Türkçe
2022
Bilim ve TeknolojiYıldız Teknik ÜniversitesiHarita Mühendisliği Ana Bilim Dalı
PROF. DR. BÜLENT BAYRAM
- Navigation based on inertial sensor data using deep learning techniques
Ataletsel sensör verileriyle derin öğrenme teknikleri kullanılarak navigasyon
MUHAMMET SERHAT SOYER
Yüksek Lisans
İngilizce
2021
Elektrik ve Elektronik MühendisliğiKoç ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ MEHMET CENGİZ ONBAŞLI
- Land cover and land use classification of multi-modal high-resolution satellite images using multi-task deep learning approach
Çok görevli derin öğrenme tekniği ile çok kipli yüksek çözünürlüklü uydu görüntülerinin arazi örtüsü ve arazi kullanımı sınıflandırılması
BURAK EKİM
Yüksek Lisans
İngilizce
2021
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesiİletişim Sistemleri Ana Bilim Dalı
PROF. DR. ELİF SERTEL
- Applications of multi-agent systems in transportation
Ulaşımda çoklu ajan sistemlerinin uygulamaları
İLHAN TUNÇ
Doktora
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiMekatronik Mühendisliği Ana Bilim Dalı
PROF. DR. MEHMET TURAN SÖYLEMEZ
- Nesneye yönelik kural tabanlı sınıflandırma ve derin öğrenme yöntemleri ile otomatik yol çıkarımı olanaklarının araştırılması
Investigation of automatic road extraction possibilities with object oriented rule-based classification and deep learning methods
ZEYNEP BAYRAMOĞLU
Yüksek Lisans
Türkçe
2021
Jeodezi ve FotogrametriYıldız Teknik ÜniversitesiHarita Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ANİME MELİS UZAR DİNLEMEK