A crowd-aware and self-supervised approach for object detection in wide area motion imagery
Geniş alan hareketli görüntülerde nesne tespiti için kendi kendini denetleyen ve kalabalığın farkında yöntem
- Tez No: 809430
- Danışmanlar: PROF. DR. CEM İYİGÜN, PROF. DR. SİNAN KALKAN
- Tez Türü: Doktora
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Bilim ve Teknoloji, Endüstri ve Endüstri Mühendisliği, Computer Engineering and Computer Science and Control, Science and Technology, Industrial and Industrial Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2023
- Dil: İngilizce
- Üniversite: Orta Doğu Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Endüstri Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Endüstri Mühendisliği Bilim Dalı
- Sayfa Sayısı: 168
Özet
Geniş Alan Hareketli Görüntülerde (WAMI) nesnelerin algılanması bir çok WAMI uygulaması için temel bir işlev olup, özellikle trafiğin olduğu alanlar gibi kalabalık bölgelerde oldukça zorlayıcı bir problemdir. Nesnelerin piksel çözünürlüklerinin düşük olması, yer örnekleme mesafesinin oldukça büyük olması ve bunlara ek birçok farklı faktör görsel sinyallerin bozulmasına bu problemin zorlayıcılığının ana faktörleri olarak görülebilir. Bu zorluğun üstesinden gelmek için, uzamsal-zamansal aşamalı mimariler ile tasarlanmış iki çözüm yaklaşım önermekteyiz. Derin ağ mimarileri birbirine benzer olsa da, bu iki yaklaşımın eğitim ve çalışma ilkeleri büyük ölçüde farklılık göstermektedir. Yaklaşımlardan biri verilen temel doğru bilgisini kullanıp tamamen denetimli öğrenme ilkelerinden yararlanırken, ikinci yöntem hareketli bir nesne detektörü oluşturmak için hedeflerin konumları hakkında herhangi bir ön bilgiye ihtiyaç duymaz. Bildiğimiz kadarıyla, ikinci yaklaşım, WAMI'de nesne tespiti için yer gerçeği bilgisi kullanılmadan eğitilen ilk derin uzaysal-zamansal yöntemdir. Ayrıca, WAMI'de özellikle kalabalık alanlarda tespit performansını artırabilmek adına derin ağları eğitmek için yeni bir kalabalığın farkında eşikli kayıp (CATLoss) fonksiyonu önermekteyiz. Parametre eklemesi yapmadan geniş bağlamsal bilgileri daha iyi birleştirebilmek için, literatürde kullanılan önceki ağları genişletilmiş evrişim katmanlarıyla donatıyoruz. Özetle yaklaşımlarımız nedensel, genelleştirilebilir ve küçültülmüş uzamsal boyutlarda bile başarılı olacak şekilde tasarlanmıştır. WPAFB-2009 veri setinde, çıkarım sırasında herhangi bir hesaplama karmaşıklığı getirmeden çözümlerimizin en son teknolojiden daha iyi veya ona eşit performans sergilediğini göstermekteyiz.
Özet (Çeviri)
Detecting objects in Wide Area Motion Imagery (WAMI), an essential task for many practical applications, is particularly challenging in crowded scenes, such as areas with heavy traffic, since pixel resolutions of objects and ground sampling distance are highly compromised, and different factors disrupt visual signals. To address this challenge, we introduce two novel approaches including spatio-temporal cascaded architectures. Even though the deep detector architectures are similar, the training and operating principles of these two approaches differ greatly. While one of the approaches uses the given ground truth information and utilizes completely supervised learning principles, the second one does not need any prior knowledge about the locations of the targets to build a moving object detector. To the best of our knowledge, the latter approach is the first deep spatio-temporal approach trained without using ground truth information to detect objects in WAMI. Moreover, we propose a novel crowd-aware thresholded loss (CATLoss) function for training deep networks for detection in WAMI for improved performance in especially crowded areas. Furthermore, to incorporate more contextual information without introducing additional parameters, we extend prior networks used in the literature with dilated convolution layers. Overall, our approaches are causal, more generalizable, and more robust even in reduced spatial sizes. On the WPAFB-2009 dataset, we show that our solutions perform better than or on par with state-of-the-art without introducing any computational complexity during inference.
Benzer Tezler
- Akran danışmanlığının hemşirelik öğrencilerinin sosyal-duygusal öğrenme becerilerine ve sosyal öz- yeterliğine etkisi
Peer counseling for nursing students social-emotional learning skills and social self-impact on competency
AYŞE NUR AYDEMİR
Yüksek Lisans
Türkçe
2024
Eğitim ve Öğretimİstanbul Üniversitesi-CerrahpaşaHemşirelikte Eğitim Ana Bilim Dalı
DOÇ. DR. EMİNE ŞENYUVA
- A multiple case study on students' speaking anxiety: Perspectives of students and teachers
Öğrencilerin konuşma kaygısı üzerine çoklu bir durum çalışması: Öğrenci ve öğretmen bakış açısı
BENSU ZAMBAK
Yüksek Lisans
İngilizce
2023
Eğitim ve ÖğretimDokuz Eylül ÜniversitesiYabancı Diller Eğitimi Ana Bilim Dalı
PROF. DR. YEŞİM BEKTAŞ ÇETİNKAYA
- Uluslararası fon piyasaları ve döviz kredileri mekanizması (analitik bir yaklaşım)
A Short history of the foreign exchange markets
ADNAN YİĞİT
Yüksek Lisans
Türkçe
1994
BankacılıkMarmara ÜniversitesiUluslararası Bankacılık ve Finans Ana Bilim Dalı
PROF. DR. İLHAN ULUDAĞ
- Bir Rönesans dehası: Christopher Marlowe
Başlık çevirisi yok
GÜNSELİ İŞÇİ
Doktora
Türkçe
1989
Sahne ve Görüntü SanatlarıEge ÜniversitesiBatı Dilleri ve Edebiyatları Ana Bilim Dalı
PROF. DR. SEÇKİN ERGİN