A crowd-aware and self-supervised approach for object detection in wide area motion imagery

Geniş alan hareketli görüntülerde nesne tespiti için kendi kendini denetleyen ve kalabalığın farkında yöntem

PDF İndir

Tez No: 809430
Yazar: POYRAZ UMUT HATİPOĞLU
Danışmanlar: PROF. DR. CEM İYİGÜN, PROF. DR. SİNAN KALKAN
Tez Türü: Doktora
Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Bilim ve Teknoloji, Endüstri ve Endüstri Mühendisliği, Computer Engineering and Computer Science and Control, Science and Technology, Industrial and Industrial Engineering
Anahtar Kelimeler: Belirtilmemiş.
Yıl: 2023
Dil: İngilizce
Üniversite: Orta Doğu Teknik Üniversitesi
Enstitü: Fen Bilimleri Enstitüsü
Ana Bilim Dalı: Endüstri Mühendisliği Ana Bilim Dalı
Bilim Dalı: Endüstri Mühendisliği Bilim Dalı
Sayfa Sayısı: 168

Özet

Geniş Alan Hareketli Görüntülerde (WAMI) nesnelerin algılanması bir çok WAMI uygulaması için temel bir işlev olup, özellikle trafiğin olduğu alanlar gibi kalabalık bölgelerde oldukça zorlayıcı bir problemdir. Nesnelerin piksel çözünürlüklerinin düşük olması, yer örnekleme mesafesinin oldukça büyük olması ve bunlara ek birçok farklı faktör görsel sinyallerin bozulmasına bu problemin zorlayıcılığının ana faktörleri olarak görülebilir. Bu zorluğun üstesinden gelmek için, uzamsal-zamansal aşamalı mimariler ile tasarlanmış iki çözüm yaklaşım önermekteyiz. Derin ağ mimarileri birbirine benzer olsa da, bu iki yaklaşımın eğitim ve çalışma ilkeleri büyük ölçüde farklılık göstermektedir. Yaklaşımlardan biri verilen temel doğru bilgisini kullanıp tamamen denetimli öğrenme ilkelerinden yararlanırken, ikinci yöntem hareketli bir nesne detektörü oluşturmak için hedeflerin konumları hakkında herhangi bir ön bilgiye ihtiyaç duymaz. Bildiğimiz kadarıyla, ikinci yaklaşım, WAMI'de nesne tespiti için yer gerçeği bilgisi kullanılmadan eğitilen ilk derin uzaysal-zamansal yöntemdir. Ayrıca, WAMI'de özellikle kalabalık alanlarda tespit performansını artırabilmek adına derin ağları eğitmek için yeni bir kalabalığın farkında eşikli kayıp (CATLoss) fonksiyonu önermekteyiz. Parametre eklemesi yapmadan geniş bağlamsal bilgileri daha iyi birleştirebilmek için, literatürde kullanılan önceki ağları genişletilmiş evrişim katmanlarıyla donatıyoruz. Özetle yaklaşımlarımız nedensel, genelleştirilebilir ve küçültülmüş uzamsal boyutlarda bile başarılı olacak şekilde tasarlanmıştır. WPAFB-2009 veri setinde, çıkarım sırasında herhangi bir hesaplama karmaşıklığı getirmeden çözümlerimizin en son teknolojiden daha iyi veya ona eşit performans sergilediğini göstermekteyiz.

Özet (Çeviri)

Detecting objects in Wide Area Motion Imagery (WAMI), an essential task for many practical applications, is particularly challenging in crowded scenes, such as areas with heavy traffic, since pixel resolutions of objects and ground sampling distance are highly compromised, and different factors disrupt visual signals. To address this challenge, we introduce two novel approaches including spatio-temporal cascaded architectures. Even though the deep detector architectures are similar, the training and operating principles of these two approaches differ greatly. While one of the approaches uses the given ground truth information and utilizes completely supervised learning principles, the second one does not need any prior knowledge about the locations of the targets to build a moving object detector. To the best of our knowledge, the latter approach is the first deep spatio-temporal approach trained without using ground truth information to detect objects in WAMI. Moreover, we propose a novel crowd-aware thresholded loss (CATLoss) function for training deep networks for detection in WAMI for improved performance in especially crowded areas. Furthermore, to incorporate more contextual information without introducing additional parameters, we extend prior networks used in the literature with dilated convolution layers. Overall, our approaches are causal, more generalizable, and more robust even in reduced spatial sizes. On the WPAFB-2009 dataset, we show that our solutions perform better than or on par with state-of-the-art without introducing any computational complexity during inference.

Benzer Tezler

Tez No
910859
Akran danışmanlığının hemşirelik öğrencilerinin sosyal-duygusal öğrenme becerilerine ve sosyal öz- yeterliğine etkisi
Peer counseling for nursing students social-emotional learning skills and social self-impact on competency
AYŞE NUR AYDEMİR
Yüksek Lisans
Türkçe
2024
Eğitim ve Öğretim İstanbul Üniversitesi-Cerrahpaşa
Hemşirelikte Eğitim Ana Bilim Dalı
DOÇ. DR. EMİNE ŞENYUVA
Tez No
967045
Angoisse et authenticité chez Heidegger, Kierkegaard et Freud
Heidegger, Kierkegaard ve Freud'da bunalma ve özgünlük
MELİS SARE DERE
Yüksek Lisans
Fransızca
2025
Felsefe Galatasaray Üniversitesi
Felsefe Ana Bilim Dalı
DOÇ. DR. UMUT ÖKSÜZAN
Tez No
809918
A multiple case study on students' speaking anxiety: Perspectives of students and teachers
Öğrencilerin konuşma kaygısı üzerine çoklu bir durum çalışması: Öğrenci ve öğretmen bakış açısı
BENSU ZAMBAK
Yüksek Lisans
İngilizce
2023
Eğitim ve Öğretim Dokuz Eylül Üniversitesi
Yabancı Diller Eğitimi Ana Bilim Dalı
PROF. DR. YEŞİM BEKTAŞ ÇETİNKAYA
Tez No
30850
Uluslararası fon piyasaları ve döviz kredileri mekanizması (analitik bir yaklaşım)
A Short history of the foreign exchange markets
ADNAN YİĞİT
Yüksek Lisans
Türkçe
1994
Bankacılık Marmara Üniversitesi
Uluslararası Bankacılık ve Finans Ana Bilim Dalı
PROF. DR. İLHAN ULUDAĞ
Tez No
7247
Bir Rönesans dehası: Christopher Marlowe
Başlık çevirisi yok
GÜNSELİ İŞÇİ
Doktora
Türkçe
1989
Sahne ve Görüntü Sanatları Ege Üniversitesi
Batı Dilleri ve Edebiyatları Ana Bilim Dalı
PROF. DR. SEÇKİN ERGİN

Geri Dön