Geri Dön

Compressed domain video understanding methods for traffic surveillance applications

Trafik izleme uygulamaları için sıkıştırılmış alanda video anlamlandırma yöntemleri

  1. Tez No: 900008
  2. Yazar: MUHAMMET SEBUL BERATOĞLU
  3. Danışmanlar: PROF. DR. BEHÇET UĞUR TÖREYİN
  4. Tez Türü: Doktora
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2023
  8. Dil: İngilizce
  9. Üniversite: İstanbul Teknik Üniversitesi
  10. Enstitü: Bilişim Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Bilimleri Ana Bilim Dalı
  12. Bilim Dalı: Bilgisayar Bilimleri Bilim Dalı
  13. Sayfa Sayısı: 127

Özet

Video analizi için geleneksel yöntemler yüksek miktarda kaynak ve zamana ihtiyaç duyar. Bu zorlukları hafifletmek için, bu tezde, sıkıştırılmış alanda çalışan ve özellikle trafik gözetim uygulamaları için tasarlanmış 4 yeni yöntem önerilmiştir. Tez kapsamında sunulan çalışmaların önemli noktalarını aşağıdaki sıralanmıştır: 1. Video aktarımında kullanılan sıkıştırma algoritmalarının ana amacı veri transferini minimize etmektir. Özellikle, kare-içi (Intra Frame) kodlanmış çerçeveler için, artık bilgisi iletilen verinin yüzde 90'ına kadar çıkabilir. Artık bilgiye gereksinim duymadan, veri iletim gereksinimlerinde önemli bir azalma sağlayarak, nesne tespitinin mümkün olduğu gösterilmiştir. 2. Sıkıştırılmış alanda önerilen yöntemlerle, uygulamalarda kullanılan bellek miktarının önemli ölçüde azaltılabileceği oranında azaltılabileceği gösterilmiştir. 3. Önerilen yöntemlerin, piksel alanına göre 1.25 ile 4 kez arasında hızlanma sağladığı gösterilmiştir. 4. Önerilen yöntemler sıkıştırılmış alanda piksel alanına yakın başarımla plaka yerinin tespit edilebildiği gösterilmiştir. 5. Önerilen yöntemlerle, kamuya açık bir veri setinde, piksel alanına eşdeğer düzeyde araç tespiti yapılabildiği gösterilmiştir. 6. Sıkıştırılmış alanda, araç sınıflandırmanın yapılabildiği gösterilmiştir. Sıkıştırılmış alanda araçları 6 kategoriye sınıflandırabilen bilinen ilk çalışma olmuştur. Daha önce piksel alanında elde edilen birçok çalışmanın üzerinde başarım sağlanmıştır. 7. Video aktarımında artık veri kullanılmadan görüntülerin yeniden oluşturulması üzerine özgün bir yöntem önerilmiştir. Araç algılama ve sınıflandırma problemi üzerinde test edilen yöntemin %96,84 başarıma ulaştığı gösterilmiştir. Bu yöntemin, sıkıştırılmış alanda farklı türde sınıflandırma problemlerini çözme potansiyeline sahip olduğu görülmüştür.

Özet (Çeviri)

In the realm of traffic monitoring, efficient video analysis is paramount yet challenging due to intensive computational demands. This thesis addresses this issue by introducing novel methods to operate in the compressed domain. Four methods are proposed for image reconstruction from High Efficiency Video Coding (HEVC) Intra bitstreams, namely, the Block Partition Based Method (Mbp), the Prediction Unit Based Method (Mpu), the Random Perturbation Based Method (Mrp), and the Luma based method (My). These methods aim to provide a compact representation of the original image while retaining relevant information for video understanding tasks. Our methods substantially reduce data transmission requirements and memory footprint. Specifically, images created via Mbp and Mpu require 1/1,536 and 1/192 of the memory needed by pixel domain images, respectively. Moreover, these methods offer computational speedup between 1.25 to 4 times, yielding efficiencies in video analysis. The proposed techniques have shown promising results in detecting vehicle license plates and classifying vehicles, with accuracies matching or surpassing pixel area levels. For instance, Mbp and Mpu accurately identified license plate locations, achieving accuracies of 93.33% and 99.02%, respectively. The vehicle detection process showed speed enhancements and high accuracies with both Mrp and My methods. Our work sets the foundation for future research, exploring avenues such as full video decoding, hybrid approaches combining compressed and pixel domain information, and extending the proposed methods to other object detection applications. In conclusion, our methods present a significant stride towards efficient video analysis in traffic surveillance, enhancing computational performance while maintaining high detection and classification accuracy.

Benzer Tezler

  1. Efficient deep learning approaches for signal and image analysis applications

    Sinyal ve görüntü analizi uygulamaları için verimli derin öğrenme yaklaşımları

    ONUR CAN KOYUN

    Doktora

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Bilimleri Ana Bilim Dalı

    PROF. DR. BEHÇET UĞUR TÖREYİN

  2. Comparative analysis of deep learning components on compressed domain action recogniton framework

    Derin öğrenme bileşenlerinin sıkıştırılmış domen aktivite tanıma sistemi üzerinde karşılaştırmalı analizi

    HÜSEYİN ONUR YAĞAR

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Bilimleri Ana Bilim Dalı

    PROF. DR. BEHÇET UĞUR TÖREYİN

  3. Compressed domain H.264/AVC video editing

    H.264/AVC sıkışmış uzayında görüntü düzenleme

    ERTUĞRUL DOĞAN

    Yüksek Lisans

    İngilizce

    İngilizce

    2008

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    PROF. DR. MELİH PAZARCI

  4. An approach to summarize video data in compressed domain

    Sıkıştırılmış bölgede video verilerinin özetlenmesi için bir yaklaşım

    GÖKHAN ŞİMŞEK

    Yüksek Lisans

    İngilizce

    İngilizce

    2007

    Bilim ve Teknolojiİzmir Yüksek Teknoloji Enstitüsü

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. ŞEVKET GÜMÜŞTEKİN

  5. Ayrıksı hareket vektörü ayıklama algoritmasıyla gerçek zamanlı global hareket kestirimi

    Motion vector outlier rejection algorithm for real time global motion estimation

    BURAK YILDIRIM

    Yüksek Lisans

    Türkçe

    Türkçe

    2014

    Elektrik ve Elektronik MühendisliğiAnkara Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. HAKKI ALPARSLAN ILGIN