Geri Dön

Derin öğrenme tabanlı şiddet detektörü

Deep learning based violence detection

  1. Tez No: 856812
  2. Yazar: MUSTAFA KESER
  3. Danışmanlar: PROF. DR. HAYRİ SEVER
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2024
  8. Dil: Türkçe
  9. Üniversite: Çankaya Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Veri Analitiği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: Belirtilmemiş.

Özet

Hareket tanıma, bilgisayarlı görü alanı içerisinde hem RGB alanında hem de derinlik haritaları üzerinde oldukça fazla çalışılmış bir konu olsa da videolardaki şiddet içeren hareketlerin tespiti nispeten daha az çalışılmış güncel bir alandır. Günümüzde insanların yaşadığı hemen her alanda kamera sistemi bulunmasına karşın bu görüntülerin analizi konusunda hâlen çok fazla çalışma bulunmamaktadır. Artan kamera sayısı ile beraber biriken veri miktarı sonucunda akıllı aktivite tespit sitemlerine oldukça gereksinim duyulmaktadır. Bu proje ile kamera sistemlerinde video etiketleme sistemleri kapsamında kullanılabilecek bir şiddet tanıma yaklaşımı geliştirmek hedeflenmektedir. Gelişen teknolojiyle beraber yaygınlaşan ve bant genişliği artan internet sayesinde büyük miktardaki video verisine kolayca erişilebilmektedir. Videolarda şiddet içeren sahnelerin etiketlenmesi, güvenlik ve içerik tabanlı video arama sistemi bakımından önem arz etmektedir. Güvenlik kameraları şiddet eylemlerini tespit etmek için uygun değildir. Büyük ölçekli kamera sistemlerinde insan operatörünün bütün kameraları izlemesi neredeyse imkânsızdır. Bu nedenle videolarda şiddet tespiti önem kazanmaktadır. Bu projeyle, mevcut yöntemlerden daha verimli sonuçlar üreten yeni bir derin öğrenme tabanlı şiddet detektörü geliştirilmesi hedeflenmiştir. Bu çalışmada, video görüntüleri üzerinden Transfer Öğrenme ve Long Short Term Memory (LSTM) ağı yaklaşımlı bir yöntem kullanılmıştır. MobileNetV2 ardışık video karelerinden uzamsal özellikleri çıkartmak için yararlanılmıştır. Ayrıca, BILSTM yerel uzamsal özellikleri koruyup video kareleri arasındaki ilişkiler zamansal olarak analiz edilmiştir. Bu çalışmada en iyi sonucu hockey fight veri seti kullanılarak %99,37 değeri elde edilmiştir. Bu değer, yapılan birçok çalışmadan daha yüksek başarı oranına sahiptir.

Özet (Çeviri)

substantial attention, both in RGB and depth maps. However, the identification of aggressive movements within video sequences remains an area that is relatively underexplored and contemporaneous. Despite the omnipresence of camera systems across diverse spheres of human life, there exists a palpable dearth in research pertaining to the nuanced analysis of these visual data streams. The escalating ubiquity of cameras has precipitated an exponential accumulation of data, thereby engendering a pressing exigency for sophisticated systems capable of discerning intricate human activities. This project endeavors to craft an innovative violence recognition paradigm tailored for integration within video annotation systems, specifically designed for camera setups. The proliferation of technology has facilitated unfettered access to copious volumes of video data owing to the burgeoning internet bandwidth. The meticulous annotation of video segments portraying acts of violence assumes paramount significance, especially within the domains of security and content-driven video retrieval systems. Security cameras, however, evince limitations in accurately discerning violent acts, while the task of exhaustive monitoring by human operators in expansive camera networks approaches insurmountability. Consequently, the identification of violence within video footage has emerged as a critical concern This project aspires to forge a novel deep learning-driven violence detection mechanism that proffers superior efficacy when juxtaposed against prevailing methodologies. The present study methodically employs Transfer Learning in conjunction with a Long Short Term Memory (LSTM) network specifically tailored for video frames. Leveraging MobileNetV2 facilitates the extraction of spatial features from successive video frames. Concurrently, BILSTM endeavors to preserve localized spatial attributes while meticulously scrutinizing temporal interrelations inherent within video frames. In this study, the best result was obtained by using the hockey fight data set, with a value of 99.37%, eclipsing the performance benchmarks set forth by antecedent studies.

Benzer Tezler

  1. Görüntü verilerinde derin öğrenme tabanlı yüz tanıma ve fiziksel şiddet olaylarının adli bilişim açısından tespiti

    Deep learning-based facial recognition in image data and detection of physical violence incidents in terms of forensics

    SERKAN KARAKUŞ

    Doktora

    Türkçe

    Türkçe

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolFırat Üniversitesi

    Yazılım Mühendisliği Ana Bilim Dalı

    DOÇ. DR. SEDA ARSLAN TUNCER

    DR. ÖĞR. ÜYESİ MUSTAFA KAYA

  2. Videolarda derin öğrenme yaklaşımları ile anormal durum tespiti ve boyut indirgeme sistemi

    Anomaly detection and size reduction system with deep learning approaches in videos

    MEHMET TEVFİK AĞDAŞ

    Doktora

    Türkçe

    Türkçe

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Üniversitesi

    Enformatik Ana Bilim Dalı

    PROF. DR. SEVİNÇ GÜLSEÇEN

  3. Dijital oyunlarda siber terörün yapay zekâ ile tespiti ve erişime engellenmesi

    Detection and prevention of cyber terrorism in digital games using deep learning

    AHMET EDİP ÇAPANOĞLU

    Doktora

    Türkçe

    Türkçe

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi Üniversitesi

    Adli Bilişim Ana Bilim Dalı

    DOÇ. DR. NURSEL YALÇIN

  4. Zararlı video içeriklerinin derin öğrenme teknikleri ile tespiti ve filtrelenmesi için bir yazılım aracı geliştirilmesi

    Development of a software tool for detecting and filtering harmful video content with deep learning techniques

    FATMA GÜLŞAH TAN

    Doktora

    Türkçe

    Türkçe

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSüleyman Demirel Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ASIM SİNAN YÜKSEL

  5. Deep neural network (DNN) based multilingual speaker age estimation

    Derin sinir ağı (DSA) tabanlı çok dilli konuşmacı yaş tahmini

    MOHAMMED MUNTAZ OSMAN

    Doktora

    İngilizce

    İngilizce

    2021

    Elektrik ve Elektronik MühendisliğiKocaeli Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    DOÇ. DR. OSMAN BÜYÜK