Geri Dön

Deep learning architectures for smart urban scene analysis

Akıllı kentsel sahne analizi için derin öğrenme mimarileri

  1. Tez No: 771049
  2. Yazar: TUBA DEMİRTAŞ
  3. Danışmanlar: DR. ÖĞR. ÜYESİ İSMAİL BURAK PARLAK
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2022
  8. Dil: İngilizce
  9. Üniversite: Galatasaray Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Akıllı Sistemler Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Akıllı Sistemler Mühendisliği Bilim Dalı
  13. Sayfa Sayısı: 85

Özet

Akıllı şehir analizi, otonom kentsel yaşam problemlerinde öne çıkan önemli bir alan haline geliyor. Görüntü semantiği, görüntü sınıflandırmasının, semantik bölütlemenin ve nesne algılama alt programlarının, uzay-zamansal veri kümeleri aracılığıyla kademeli bir çerçevede sahnelendiği karmaşık bir problemdir. Kentsel sahne analizi, havacılık, robotik, şehir güvenliği, otonom araçlar ve toplu taşıma gibi çeşitli uygulamalarda birleştirilmiştir. Bir kentsel sahnenin temel sorunu, bir şehrin sokaklarında ayrık 2D-3D hareketlerin izlenmesi olarak karakterize edilir. Bu nedenle, sahnedeki uzamsal boşluğu en aza indirmek için sahnenin doğru bir şekilde bölümlenmesi gerekmektedir. Eksiksiz çerçeve, kentsel sahnedeki insanları ve diğer hareketli nesneleri korumak için kritik karar verme araçları sağlar. Kazaları önlemek için yeni nesil otonom sistemler, bir sokaktaki olası tüm hareketleri izlemek için gerçek zamanlı sensörlerini çalıştırmaktadır. Ancak, şehir verisi iç görülerini oluşturmak için algılama aşamasının anlamsal düzeyde yorumlanması gerekir. Semantik bölütlemenin görevi, arka plan dahil her pikseli semantik bir sınıfa etiketlemektir. Nesne algılama ise bir sınırlayıcı kutu ile nesnelerin varlığını ve görüntüde konumlanmış nesnelerin türlerini/sınıflarını bulur. Bu nedenle, nesne algılama değişmez temsilleri gerektirirken, bölütleme eş değişken gösterimleri gerektirir. Örnek bölütleme şu iki görevi içerir: nesne algılama ve semantik/anlamsal bölütleme. Bu tez, Cityscapes veri seti aracılığıyla temel nesnelerin örnek segmentasyonundan oluşmaktadır. Yüksek çözünürlüklü görüntülere YOLACT derin öğrenme mimarisi uygulanmıştır. Yöntem tek aşamalı bölütleme gerektirdiğinden hızlı bulunmuştur. Ek olarak, büyük ölçekli nesneler için maskelerin kalitesi, küçük ölçülü objelere göre daha iyidir. Tez ile, YOLACT mimarisinin, uzamsal boşlukların daha düşük olduğu doğru bir veri kümesinde uygulanabilir görüntü etiketleri oluşturduğu sonucuna varılmıştır.

Özet (Çeviri)

Smart city analysis becomes an emerging field in autonomous urban life problems. Image semantics is a complex problem where the image classification, the semantic segmentation and the object detection subroutines are staged in a cascade framework through spatio-temporal datasets. Urban scene analysis has been coupled in several applications such as aviation, robotics, city security, autonomous vehicles, and mass transport. The initial problem of an urban scene is characterized as the pursuit of discrete 2D-3D movements on the streets of a city. Therefore, an accurate segmentation of the scene is required to minimize the spatial gap in the scene. The complete framework provides critical decision-making tools to protect the human beings and the moving objects. To prevent the accidents, new generation autonomous systems turn on their real time sensors to monitor all possible movements in a street. The task of semantic segmentation is to label every pixel including the background into a semantic class. The object detection locates the presence of objects with a bounding box and types or classes of the located objects in an image. Therefore, the detection requires the invariant representations whereas the segmentation needs the equivariant representations. The instance segmentation contains these two tasks: object detection and semantic segmentation. This thesis is composed of the instance segmentation of base objects through Cityscapes dataset. YOLACT deep learning architecture has been applied on high resolution images. The method has been found fast as it requires one stage segmentation. The quality of the masks was better for the large-scale objects.

Benzer Tezler

  1. Çok yüksek çözünürlüklü hava fotoğraflarından derin ögrenme yöntemi ile bina bölütlemesi

    Building segmentation from very high resolution aerial imagery using deep learning

    NURAN ASLANTAŞ

    Yüksek Lisans

    Türkçe

    Türkçe

    2022

    Bilim ve TeknolojiYıldız Teknik Üniversitesi

    Harita Mühendisliği Ana Bilim Dalı

    PROF. DR. BÜLENT BAYRAM

  2. Navigation based on inertial sensor data using deep learning techniques

    Ataletsel sensör verileriyle derin öğrenme teknikleri kullanılarak navigasyon

    MUHAMMET SERHAT SOYER

    Yüksek Lisans

    İngilizce

    İngilizce

    2021

    Elektrik ve Elektronik MühendisliğiKoç Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ MEHMET CENGİZ ONBAŞLI

  3. Land cover and land use classification of multi-modal high-resolution satellite images using multi-task deep learning approach

    Çok görevli derin öğrenme tekniği ile çok kipli yüksek çözünürlüklü uydu görüntülerinin arazi örtüsü ve arazi kullanımı sınıflandırılması

    BURAK EKİM

    Yüksek Lisans

    İngilizce

    İngilizce

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    İletişim Sistemleri Ana Bilim Dalı

    PROF. DR. ELİF SERTEL

  4. Applications of multi-agent systems in transportation

    Ulaşımda çoklu ajan sistemlerinin uygulamaları

    İLHAN TUNÇ

    Doktora

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Mekatronik Mühendisliği Ana Bilim Dalı

    PROF. DR. MEHMET TURAN SÖYLEMEZ

  5. Nesneye yönelik kural tabanlı sınıflandırma ve derin öğrenme yöntemleri ile otomatik yol çıkarımı olanaklarının araştırılması

    Investigation of automatic road extraction possibilities with object oriented rule-based classification and deep learning methods

    ZEYNEP BAYRAMOĞLU

    Yüksek Lisans

    Türkçe

    Türkçe

    2021

    Jeodezi ve FotogrametriYıldız Teknik Üniversitesi

    Harita Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ANİME MELİS UZAR DİNLEMEK