Compressed domain video understanding methods for traffic surveillance applications
Trafik izleme uygulamaları için sıkıştırılmış alanda video anlamlandırma yöntemleri
- Tez No: 900008
- Danışmanlar: PROF. DR. BEHÇET UĞUR TÖREYİN
- Tez Türü: Doktora
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2023
- Dil: İngilizce
- Üniversite: İstanbul Teknik Üniversitesi
- Enstitü: Bilişim Enstitüsü
- Ana Bilim Dalı: Bilgisayar Bilimleri Ana Bilim Dalı
- Bilim Dalı: Bilgisayar Bilimleri Bilim Dalı
- Sayfa Sayısı: 127
Özet
Video analizi için geleneksel yöntemler yüksek miktarda kaynak ve zamana ihtiyaç duyar. Bu zorlukları hafifletmek için, bu tezde, sıkıştırılmış alanda çalışan ve özellikle trafik gözetim uygulamaları için tasarlanmış 4 yeni yöntem önerilmiştir. Tez kapsamında sunulan çalışmaların önemli noktalarını aşağıdaki sıralanmıştır: 1. Video aktarımında kullanılan sıkıştırma algoritmalarının ana amacı veri transferini minimize etmektir. Özellikle, kare-içi (Intra Frame) kodlanmış çerçeveler için, artık bilgisi iletilen verinin yüzde 90'ına kadar çıkabilir. Artık bilgiye gereksinim duymadan, veri iletim gereksinimlerinde önemli bir azalma sağlayarak, nesne tespitinin mümkün olduğu gösterilmiştir. 2. Sıkıştırılmış alanda önerilen yöntemlerle, uygulamalarda kullanılan bellek miktarının önemli ölçüde azaltılabileceği oranında azaltılabileceği gösterilmiştir. 3. Önerilen yöntemlerin, piksel alanına göre 1.25 ile 4 kez arasında hızlanma sağladığı gösterilmiştir. 4. Önerilen yöntemler sıkıştırılmış alanda piksel alanına yakın başarımla plaka yerinin tespit edilebildiği gösterilmiştir. 5. Önerilen yöntemlerle, kamuya açık bir veri setinde, piksel alanına eşdeğer düzeyde araç tespiti yapılabildiği gösterilmiştir. 6. Sıkıştırılmış alanda, araç sınıflandırmanın yapılabildiği gösterilmiştir. Sıkıştırılmış alanda araçları 6 kategoriye sınıflandırabilen bilinen ilk çalışma olmuştur. Daha önce piksel alanında elde edilen birçok çalışmanın üzerinde başarım sağlanmıştır. 7. Video aktarımında artık veri kullanılmadan görüntülerin yeniden oluşturulması üzerine özgün bir yöntem önerilmiştir. Araç algılama ve sınıflandırma problemi üzerinde test edilen yöntemin %96,84 başarıma ulaştığı gösterilmiştir. Bu yöntemin, sıkıştırılmış alanda farklı türde sınıflandırma problemlerini çözme potansiyeline sahip olduğu görülmüştür.
Özet (Çeviri)
In the realm of traffic monitoring, efficient video analysis is paramount yet challenging due to intensive computational demands. This thesis addresses this issue by introducing novel methods to operate in the compressed domain. Four methods are proposed for image reconstruction from High Efficiency Video Coding (HEVC) Intra bitstreams, namely, the Block Partition Based Method (Mbp), the Prediction Unit Based Method (Mpu), the Random Perturbation Based Method (Mrp), and the Luma based method (My). These methods aim to provide a compact representation of the original image while retaining relevant information for video understanding tasks. Our methods substantially reduce data transmission requirements and memory footprint. Specifically, images created via Mbp and Mpu require 1/1,536 and 1/192 of the memory needed by pixel domain images, respectively. Moreover, these methods offer computational speedup between 1.25 to 4 times, yielding efficiencies in video analysis. The proposed techniques have shown promising results in detecting vehicle license plates and classifying vehicles, with accuracies matching or surpassing pixel area levels. For instance, Mbp and Mpu accurately identified license plate locations, achieving accuracies of 93.33% and 99.02%, respectively. The vehicle detection process showed speed enhancements and high accuracies with both Mrp and My methods. Our work sets the foundation for future research, exploring avenues such as full video decoding, hybrid approaches combining compressed and pixel domain information, and extending the proposed methods to other object detection applications. In conclusion, our methods present a significant stride towards efficient video analysis in traffic surveillance, enhancing computational performance while maintaining high detection and classification accuracy.
Benzer Tezler
- Efficient deep learning approaches for signal and image analysis applications
Sinyal ve görüntü analizi uygulamaları için verimli derin öğrenme yaklaşımları
ONUR CAN KOYUN
Doktora
İngilizce
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Bilimleri Ana Bilim Dalı
PROF. DR. BEHÇET UĞUR TÖREYİN
- Comparative analysis of deep learning components on compressed domain action recogniton framework
Derin öğrenme bileşenlerinin sıkıştırılmış domen aktivite tanıma sistemi üzerinde karşılaştırmalı analizi
HÜSEYİN ONUR YAĞAR
Yüksek Lisans
İngilizce
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Bilimleri Ana Bilim Dalı
PROF. DR. BEHÇET UĞUR TÖREYİN
- Compressed domain H.264/AVC video editing
H.264/AVC sıkışmış uzayında görüntü düzenleme
ERTUĞRUL DOĞAN
Yüksek Lisans
İngilizce
2008
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
PROF. DR. MELİH PAZARCI
- An approach to summarize video data in compressed domain
Sıkıştırılmış bölgede video verilerinin özetlenmesi için bir yaklaşım
GÖKHAN ŞİMŞEK
Yüksek Lisans
İngilizce
2007
Bilim ve Teknolojiİzmir Yüksek Teknoloji EnstitüsüElektrik-Elektronik Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. ŞEVKET GÜMÜŞTEKİN
- Ayrıksı hareket vektörü ayıklama algoritmasıyla gerçek zamanlı global hareket kestirimi
Motion vector outlier rejection algorithm for real time global motion estimation
BURAK YILDIRIM
Yüksek Lisans
Türkçe
2014
Elektrik ve Elektronik MühendisliğiAnkara ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. HAKKI ALPARSLAN ILGIN