Video görüntüleri üzerinde nesnelerin mekansal-zamansal bütünleşik çerçevesinde anlamlandırılması

Giving meaning to objects on video footage in the spatial-temporal unified framework

PDF İndir

Tez No: 783792
Yazar: TANSU TEMEL
Danışmanlar: PROF. DR. YAŞAR HOŞCAN, DR. ÖĞR. ÜYESİ MEHMET KILIÇARSLAN
Tez Türü: Doktora
Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
Anahtar Kelimeler: Belirtilmemiş.
Yıl: 2023
Dil: Türkçe
Üniversite: Eskişehir Teknik Üniversitesi
Enstitü: Lisansüstü Eğitim Enstitüsü
Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
Bilim Dalı: Donanım Bilim Dalı
Sayfa Sayısı: 69

Özet

Video görüntülerinin işlenmesi günümüzde çok rağbet gören fakat o ölçüde de zorlu bir görevdir. Görüntü işleme yöntemleriyle, hareketli ve sabit kamera görüntülerinden anlamlı bilgiler çıkarılabilmektedir. Hareketli kameralardan elde edilen görüntüler üzerinde çalışmanın en zorlu unsurlarından biri, nesnelerin, sürekli değişen bir ortamda yer almasıdır. Buna ek olarak, video görüntüleri üzerindeki gürültü, yansıma, ölçekleme ve benzeri zorluklarla baş edebilmek dayanıklı bir model geliştirmek için kritik öneme sahiptir. Yapılan tez çalışmasında araç içi video görüntüleri üzerinde araçların hareket yönleri ve aynı zamanda hareket açılarının öğrenilmesi üzerine çalışmalar yapılmıştır. Bu çalışmalarda video görüntülerinden elde edilen hareket profilleri kullanılmıştır. Bu sayede resim boyutu küçültülerek mimarinin gerçek zamanlı olarak çalışabilmesi sağlanmıştır. Araçların hareket yönlerinin öğrenilmesi aşamasında başarılı derin öğrenme mimarilerinden YOLOv3 kullanılmıştır. Buna ek olarak araçların hareket açılarının yeni bir parametre olarak öğrenilmesi aşamasında YOLOv3 geliştirilerek yeni bir mimari ortaya çıkartılmıştır. Bu sayede izleme algoritmalarına gerek kalmadan tek bir resim üzerinde araçlar, hareket yönleri ve açılarının öğrenilmesi sağlanmıştır. Elde edilen sonuçlar güncel derin öğrenme mimarileriyle baş edebilir seviyede çıkmıştır. Sunulan yöntemde kötü hava şartları, görüntüdeki gürültü vb. etmenler sonucu olumsuz olarak etkilememektedir. Böylece daha tutarlı ve dayanıklı bir sistem elde edilmiştir. Araçların hareket açıları ve yönlerinin öğrenilmesi araçların hareketlerinin anlamlandırılması ve bu sayede çarpışma önleyici sistemlerde kullanılması bakımından önem arz etmektedir.

Özet (Çeviri)

Processing video footage is a popular but challenging task today. With image processing methods, meaningful information can be extracted from moving and stable camera images. One of the most challenging aspects of working with images from moving cameras is the location of objects in an ever-changing environment. Besides, dealing with noise, reflection, scaling and similar challenges on video images is critical to developing a durable model. In the thesis study, studies were carried out on learning the motion directions of vehicles and also their motion angles using in-vehicle video images. In these studies, motion profiles obtained from video images were used. In this way, the image size was reduced, allowing the architecture to work in real time. YOLOv3, one of the successful deep learning architectures, was used to learn the motion directions of vehicles. In addition, a new architecture was created by developing YOLOv3 in the phase of learning the movement angles of vehicles as a new parameter. In this way, without the need for tracking algorithms, vehicles, motion directions, and angles can be learned on a single picture. The results obtained are at a level that can cope with current deep-learning architectures. In the presented method, bad weather conditions, noise in the image etc. factors do not adversely affect the result. Thus, a more consistent and durable system was obtained. Learning the movement angles and directions of the vehicles is important in terms of making sense of the movements of the vehicles and thus using them in anti-collision systems.

Benzer Tezler

Tez No
759996
Derin öğrenme ile cerrahi video anlama
Surgical video understanding with deep learning
ABDISHAKOUR ABDILLAHI AWALE ABDISHAKOUR ABDILLAHI AWALE
Yüksek Lisans
İngilizce
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol Gazi Üniversitesi
Bilişim Sistemleri Ana Bilim Dalı
DR. ÖĞR. ÜYESİ DUYGU SARIKAYA
Tez No
961150
Anticipating robot manipulation failures using knowledge distillation
Bilgi damıtma ile robot-nesne etkileşim hatalarını tahminleme
TUĞÇE TEMEL
Yüksek Lisans
İngilizce
2025
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol İstanbul Teknik Üniversitesi
Bilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. SANEM SARIEL UZER
Tez No
922004
Enhancing smart environments through an ai-assisted IORT agent
Akıllı ortamların yapay zekâ destekli bir İORT aracısıyla güçlendirilmesi
YAKUP KAYATAŞ
Yüksek Lisans
İngilizce
2025
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol İstanbul Teknik Üniversitesi
Bilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ SANEM KABADAYI
Tez No
634583
Telekomünikasyon sektöründe kullanılan ek odaların sokak düzeyi görüntülerinden tespit edilmesi
Detection of manholes from street-level imagery in telecommunication business
AHMET EĞRİ
Yüksek Lisans
Türkçe
2020
Jeodezi ve Fotogrametri İstanbul Teknik Üniversitesi
Geomatik Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ CANER GÜNEY
Tez No
710904
Designing digitally-enhanced environments for children's play with everyday objects
Çocukların günlük nesnelerle kurdukları oyunlar için sayısal teknolojiyle desteklenmiş ortamlar tasarlamak
İPEK KAY
Doktora
İngilizce
2021
Bilim ve Teknoloji İstanbul Teknik Üniversitesi
Bilişim Ana Bilim Dalı
PROF. DR. MİNE ÖZKAR KABAKÇIOĞLU

Geri Dön