Geri Dön

A crowd-aware and self-supervised approach for object detection in wide area motion imagery

Geniş alan hareketli görüntülerde nesne tespiti için kendi kendini denetleyen ve kalabalığın farkında yöntem

  1. Tez No: 809430
  2. Yazar: POYRAZ UMUT HATİPOĞLU
  3. Danışmanlar: PROF. DR. CEM İYİGÜN, PROF. DR. SİNAN KALKAN
  4. Tez Türü: Doktora
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Bilim ve Teknoloji, Endüstri ve Endüstri Mühendisliği, Computer Engineering and Computer Science and Control, Science and Technology, Industrial and Industrial Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2023
  8. Dil: İngilizce
  9. Üniversite: Orta Doğu Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Endüstri Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Endüstri Mühendisliği Bilim Dalı
  13. Sayfa Sayısı: 168

Özet

Geniş Alan Hareketli Görüntülerde (WAMI) nesnelerin algılanması bir çok WAMI uygulaması için temel bir işlev olup, özellikle trafiğin olduğu alanlar gibi kalabalık bölgelerde oldukça zorlayıcı bir problemdir. Nesnelerin piksel çözünürlüklerinin düşük olması, yer örnekleme mesafesinin oldukça büyük olması ve bunlara ek birçok farklı faktör görsel sinyallerin bozulmasına bu problemin zorlayıcılığının ana faktörleri olarak görülebilir. Bu zorluğun üstesinden gelmek için, uzamsal-zamansal aşamalı mimariler ile tasarlanmış iki çözüm yaklaşım önermekteyiz. Derin ağ mimarileri birbirine benzer olsa da, bu iki yaklaşımın eğitim ve çalışma ilkeleri büyük ölçüde farklılık göstermektedir. Yaklaşımlardan biri verilen temel doğru bilgisini kullanıp tamamen denetimli öğrenme ilkelerinden yararlanırken, ikinci yöntem hareketli bir nesne detektörü oluşturmak için hedeflerin konumları hakkında herhangi bir ön bilgiye ihtiyaç duymaz. Bildiğimiz kadarıyla, ikinci yaklaşım, WAMI'de nesne tespiti için yer gerçeği bilgisi kullanılmadan eğitilen ilk derin uzaysal-zamansal yöntemdir. Ayrıca, WAMI'de özellikle kalabalık alanlarda tespit performansını artırabilmek adına derin ağları eğitmek için yeni bir kalabalığın farkında eşikli kayıp (CATLoss) fonksiyonu önermekteyiz. Parametre eklemesi yapmadan geniş bağlamsal bilgileri daha iyi birleştirebilmek için, literatürde kullanılan önceki ağları genişletilmiş evrişim katmanlarıyla donatıyoruz. Özetle yaklaşımlarımız nedensel, genelleştirilebilir ve küçültülmüş uzamsal boyutlarda bile başarılı olacak şekilde tasarlanmıştır. WPAFB-2009 veri setinde, çıkarım sırasında herhangi bir hesaplama karmaşıklığı getirmeden çözümlerimizin en son teknolojiden daha iyi veya ona eşit performans sergilediğini göstermekteyiz.

Özet (Çeviri)

Detecting objects in Wide Area Motion Imagery (WAMI), an essential task for many practical applications, is particularly challenging in crowded scenes, such as areas with heavy traffic, since pixel resolutions of objects and ground sampling distance are highly compromised, and different factors disrupt visual signals. To address this challenge, we introduce two novel approaches including spatio-temporal cascaded architectures. Even though the deep detector architectures are similar, the training and operating principles of these two approaches differ greatly. While one of the approaches uses the given ground truth information and utilizes completely supervised learning principles, the second one does not need any prior knowledge about the locations of the targets to build a moving object detector. To the best of our knowledge, the latter approach is the first deep spatio-temporal approach trained without using ground truth information to detect objects in WAMI. Moreover, we propose a novel crowd-aware thresholded loss (CATLoss) function for training deep networks for detection in WAMI for improved performance in especially crowded areas. Furthermore, to incorporate more contextual information without introducing additional parameters, we extend prior networks used in the literature with dilated convolution layers. Overall, our approaches are causal, more generalizable, and more robust even in reduced spatial sizes. On the WPAFB-2009 dataset, we show that our solutions perform better than or on par with state-of-the-art without introducing any computational complexity during inference.

Benzer Tezler

  1. Akran danışmanlığının hemşirelik öğrencilerinin sosyal-duygusal öğrenme becerilerine ve sosyal öz- yeterliğine etkisi

    Peer counseling for nursing students social-emotional learning skills and social self-impact on competency

    AYŞE NUR AYDEMİR

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    Eğitim ve Öğretimİstanbul Üniversitesi-Cerrahpaşa

    Hemşirelikte Eğitim Ana Bilim Dalı

    DOÇ. DR. EMİNE ŞENYUVA

  2. A multiple case study on students' speaking anxiety: Perspectives of students and teachers

    Öğrencilerin konuşma kaygısı üzerine çoklu bir durum çalışması: Öğrenci ve öğretmen bakış açısı

    BENSU ZAMBAK

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Eğitim ve ÖğretimDokuz Eylül Üniversitesi

    Yabancı Diller Eğitimi Ana Bilim Dalı

    PROF. DR. YEŞİM BEKTAŞ ÇETİNKAYA

  3. Uluslararası fon piyasaları ve döviz kredileri mekanizması (analitik bir yaklaşım)

    A Short history of the foreign exchange markets

    ADNAN YİĞİT

    Yüksek Lisans

    Türkçe

    Türkçe

    1994

    BankacılıkMarmara Üniversitesi

    Uluslararası Bankacılık ve Finans Ana Bilim Dalı

    PROF. DR. İLHAN ULUDAĞ

  4. Bir Rönesans dehası: Christopher Marlowe

    Başlık çevirisi yok

    GÜNSELİ İŞÇİ

    Doktora

    Türkçe

    Türkçe

    1989

    Sahne ve Görüntü SanatlarıEge Üniversitesi

    Batı Dilleri ve Edebiyatları Ana Bilim Dalı

    PROF. DR. SEÇKİN ERGİN

  5. Emevî Halifesi II. Velîd ve dönemi

    Umayyad Caliph Walid II and his period

    SAMİ OKAN KÖSE

    Doktora

    Türkçe

    Türkçe

    2024

    TarihTokat Gaziosmanpaşa Üniversitesi

    Tarih Ana Bilim Dalı

    DOÇ. DR. MURAT SERDAR