An auto video shooting system for soccer games
Futbol maçları için otomatik video çekim sistemi
- Tez No: 640161
- Danışmanlar: PROF. DR. NAFİZ ARICA
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2020
- Dil: İngilizce
- Üniversite: Bahçeşehir Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 69
Özet
Bu tezde gürbüz bir algoritma ile bir futbol maçını otomatik olarak yayınlayabilen bir video çekim sistemi öneriyoruz. İki kameradan çekilen görüntüler, standart bir ekipman kullanılarak gerçek zamanlı olarak birleştirilir. Görüntü birleştirme sırasında kullanılan geleneksel yöntemler yerine, orijinal görüntüler ile bükülmüş görüntüler arasında bir harita oluşturmak için ArUco işaretçileri kullanılır. Bu tezde, orijinal görüntü ile bükülmüş görüntü arasındaki piksel koordinatlarını eşleştirmek için ArUco işaretçileri kullanılarak oluşturulan chArUco tahtasını kullanıyoruz. Bu sayede görüntü birleştirme prosedürünün tamamı tek bir piksel haritalama işlemi haline gelir. İki adet 4K video içeren birleştirme işlemi standart ekipman kullanılırken 36 FPS'de gerçekleşir. Algoritmanın ikinci aşaması, derin öğrenme tabanlı uzay-zaman nesne izleme olarak tanımlanır. Evrişimsel sinir ağları (CNN) ve uzun-kısa süreli bellek (LSTM) katmanları, görüntü birleştirmeden sonra elde edilen panoramik video üzerinde birlikte kullanılır. Görüntü verilerinden özellik çıkarmak için son teknoloji CNN algoritmaları vardır. Bu başarının avantajlarından yararlanan bir model oluşturuyoruz. Modelde, uzay-zaman ham veri girdi olarak kullanılır ve ilgi bölgesi (ROI) koordinatları regresyon problemi olarak eğitilir. ROI bize panoramik videodan yayınlanacak alanı gösterir. Eğitimde birleştirilmiş videolar bu prosedür için özel yazılmış bir yazılım ile insan operatörler tarafından etiketlenir. Deneysel sonuçlar, önerilen sistemin oyunculara ve topa odaklanarak futbol oyunlarını otomatik olarak çekebildiğini ve tıpkı bir insan kameraman gibi ROI'yi sorunsuz bir şekilde değiştirdiğini gösterir.
Özet (Çeviri)
In this thesis we propose a video shooting system that can broadcast a soccer game autonomously with a robust algorithm. The captured videos from two cameras are stitched in real-time using a standard equipment. Instead of the traditional methods used during image stitching, ArUco markers are used in order to produce a map from the original images to warped images. In this thesis, we use chArUco board which is created with using ArUco markers in order to match pixel coordinates between original image and warped image. In this way, the whole stitching pipeline becomes a single pixel mapping operation. The stitching process with two 4k videos takes place at 36 FPS when using standard equipment. The second stage of the algorithm is defined as deep-learning based space-time object tracking. Convolutional neural network (CNN) and long sort-term memory (LSTM) layers are used together in order to feature extraction and establish time relationship on the panoramic video obtained after stitching. There are several state-of-art CNN algorithms for feature extraction from image data. We build a model that takes advantages of this success. In the model, spatio-temporal raw data is used as an input and region of interest (ROI) coordinates trained as regression problem. The ROI shows us the area which will be broadcast from panoramic video. In training, the stitched videos are labeled by human operators with software which is specialized for this procedure. The experimental results show that the proposed system shoots the soccer games by focusing on the players and the ball autonomously and smoothly changes ROI just like an human cameraman.
Benzer Tezler
- Ağ kaynaklarını verimli kullanan bir video gözetleme sistem mimarisi
A video surveillance system architecture that uses network resources efficiently
BURCU URAL
Yüksek Lisans
Türkçe
2021
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolEge ÜniversitesiUluslararası Bilgisayar Ana Bilim Dalı
DOÇ. DR. MÜGE SAYIT
- Automatic captioning translation: Human names
Otomatik altyazı çevirisi: İnsan isimleri
İHSAN ONUR YİĞİT
Yüksek Lisans
İngilizce
2021
Mütercim-TercümanlıkHacettepe ÜniversitesiMütercim Tercümanlık Ana Bilim Dalı
PROF. DR. AYMİL DOĞAN
- Impact of quality distortions on CNN image classifiers and restoration using deep convolutional auto-encoder
Kalite bozulmalarının sınıflandırıcı CNN'ler üzerindeki etkileri ve derin konvolüsyonel auto-encoder ile düzeltilmesi
ÇAĞKAN ÇİLOĞLU
Yüksek Lisans
İngilizce
2018
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBahçeşehir ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. TAŞKIN KOÇAK
- Hybrid deep multi-criteria recommender system model
Hibrit derin çok kriterli öneri sistemi modeli
ABDULRAHMAN ALNAHHAS
Yüksek Lisans
İngilizce
2021
Endüstri ve Endüstri Mühendisliğiİstanbul Teknik ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
PROF. DR. YUSUF İLKER TOPCU
- Adaptive P2P streaming with application to multi-view video
Çoklu görüntülü video uygulaması ile adaptif P2P akıtımı
CİHAT GÖKTUĞ GÜRLER
Doktora
İngilizce
2013
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKoç ÜniversitesiElektrik Mühendisliği Ana Bilim Dalı
PROF. DR. A. MURAT TEKALP