Geri Dön

Video görüntüleri üzerinde nesnelerin mekansal-zamansal bütünleşik çerçevesinde anlamlandırılması

Giving meaning to objects on video footage in the spatial-temporal unified framework

  1. Tez No: 783792
  2. Yazar: TANSU TEMEL
  3. Danışmanlar: PROF. DR. YAŞAR HOŞCAN, DR. ÖĞR. ÜYESİ MEHMET KILIÇARSLAN
  4. Tez Türü: Doktora
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2023
  8. Dil: Türkçe
  9. Üniversite: Eskişehir Teknik Üniversitesi
  10. Enstitü: Lisansüstü Eğitim Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Donanım Bilim Dalı
  13. Sayfa Sayısı: 69

Özet

Video görüntülerinin işlenmesi günümüzde çok rağbet gören fakat o ölçüde de zorlu bir görevdir. Görüntü işleme yöntemleriyle, hareketli ve sabit kamera görüntülerinden anlamlı bilgiler çıkarılabilmektedir. Hareketli kameralardan elde edilen görüntüler üzerinde çalışmanın en zorlu unsurlarından biri, nesnelerin, sürekli değişen bir ortamda yer almasıdır. Buna ek olarak, video görüntüleri üzerindeki gürültü, yansıma, ölçekleme ve benzeri zorluklarla baş edebilmek dayanıklı bir model geliştirmek için kritik öneme sahiptir. Yapılan tez çalışmasında araç içi video görüntüleri üzerinde araçların hareket yönleri ve aynı zamanda hareket açılarının öğrenilmesi üzerine çalışmalar yapılmıştır. Bu çalışmalarda video görüntülerinden elde edilen hareket profilleri kullanılmıştır. Bu sayede resim boyutu küçültülerek mimarinin gerçek zamanlı olarak çalışabilmesi sağlanmıştır. Araçların hareket yönlerinin öğrenilmesi aşamasında başarılı derin öğrenme mimarilerinden YOLOv3 kullanılmıştır. Buna ek olarak araçların hareket açılarının yeni bir parametre olarak öğrenilmesi aşamasında YOLOv3 geliştirilerek yeni bir mimari ortaya çıkartılmıştır. Bu sayede izleme algoritmalarına gerek kalmadan tek bir resim üzerinde araçlar, hareket yönleri ve açılarının öğrenilmesi sağlanmıştır. Elde edilen sonuçlar güncel derin öğrenme mimarileriyle baş edebilir seviyede çıkmıştır. Sunulan yöntemde kötü hava şartları, görüntüdeki gürültü vb. etmenler sonucu olumsuz olarak etkilememektedir. Böylece daha tutarlı ve dayanıklı bir sistem elde edilmiştir. Araçların hareket açıları ve yönlerinin öğrenilmesi araçların hareketlerinin anlamlandırılması ve bu sayede çarpışma önleyici sistemlerde kullanılması bakımından önem arz etmektedir.

Özet (Çeviri)

Processing video footage is a popular but challenging task today. With image processing methods, meaningful information can be extracted from moving and stable camera images. One of the most challenging aspects of working with images from moving cameras is the location of objects in an ever-changing environment. Besides, dealing with noise, reflection, scaling and similar challenges on video images is critical to developing a durable model. In the thesis study, studies were carried out on learning the motion directions of vehicles and also their motion angles using in-vehicle video images. In these studies, motion profiles obtained from video images were used. In this way, the image size was reduced, allowing the architecture to work in real time. YOLOv3, one of the successful deep learning architectures, was used to learn the motion directions of vehicles. In addition, a new architecture was created by developing YOLOv3 in the phase of learning the movement angles of vehicles as a new parameter. In this way, without the need for tracking algorithms, vehicles, motion directions, and angles can be learned on a single picture. The results obtained are at a level that can cope with current deep-learning architectures. In the presented method, bad weather conditions, noise in the image etc. factors do not adversely affect the result. Thus, a more consistent and durable system was obtained. Learning the movement angles and directions of the vehicles is important in terms of making sense of the movements of the vehicles and thus using them in anti-collision systems.

Benzer Tezler

  1. Derin öğrenme ile cerrahi video anlama

    Surgical video understanding with deep learning

    ABDISHAKOUR ABDILLAHI AWALE ABDISHAKOUR ABDILLAHI AWALE

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi Üniversitesi

    Bilişim Sistemleri Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ DUYGU SARIKAYA

  2. Telekomünikasyon sektöründe kullanılan ek odaların sokak düzeyi görüntülerinden tespit edilmesi

    Detection of manholes from street-level imagery in telecommunication business

    AHMET EĞRİ

    Yüksek Lisans

    Türkçe

    Türkçe

    2020

    Jeodezi ve Fotogrametriİstanbul Teknik Üniversitesi

    Geomatik Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ CANER GÜNEY

  3. The impact of minimalist versus maximalist interior space on human short-term memory

    Maksimaliste karşı minimalist iç mekanların insanın kısa-süreli belleğine etkisi

    SHAHAD MUSTAFA FADHIL AL SAMARRAIE

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Mimarlıkİstanbul Teknik Üniversitesi

    Mimarlık Ana Bilim Dalı

    DOÇ. DR. DİLEK YILDIZ ÖZKAN

    DOÇ. DR. GÖKHAN İNCE

  4. The use of local data in architectural design through augmented reality

    Mimari tasarımda artırılmış gerçeklik aracılığıyla yerel veri kullanımı

    FARUK CAN ÜNAL

    Doktora

    İngilizce

    İngilizce

    2019

    Bilim ve Teknolojiİstanbul Teknik Üniversitesi

    Bilişim Ana Bilim Dalı

    DOÇ. DR. YÜKSEL DEMİR

  5. İç ve dış ortam çalışma sahasında gerçek zamanlı kişi tespiti ve ekipman analizi

    Real-time human detection and equipment analysis in indoor and outdoor worksite

    KADİR HIDIMOĞLU

    Doktora

    Türkçe

    Türkçe

    2023

    Elektrik ve Elektronik MühendisliğiYıldız Teknik Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ LALE ÖZYILMAZ