Geri Dön

An auto video shooting system for soccer games

Futbol maçları için otomatik video çekim sistemi

  1. Tez No: 640161
  2. Yazar: MEHMET BAYRAK
  3. Danışmanlar: PROF. DR. NAFİZ ARICA
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2020
  8. Dil: İngilizce
  9. Üniversite: Bahçeşehir Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 69

Özet

Bu tezde gürbüz bir algoritma ile bir futbol maçını otomatik olarak yayınlayabilen bir video çekim sistemi öneriyoruz. İki kameradan çekilen görüntüler, standart bir ekipman kullanılarak gerçek zamanlı olarak birleştirilir. Görüntü birleştirme sırasında kullanılan geleneksel yöntemler yerine, orijinal görüntüler ile bükülmüş görüntüler arasında bir harita oluşturmak için ArUco işaretçileri kullanılır. Bu tezde, orijinal görüntü ile bükülmüş görüntü arasındaki piksel koordinatlarını eşleştirmek için ArUco işaretçileri kullanılarak oluşturulan chArUco tahtasını kullanıyoruz. Bu sayede görüntü birleştirme prosedürünün tamamı tek bir piksel haritalama işlemi haline gelir. İki adet 4K video içeren birleştirme işlemi standart ekipman kullanılırken 36 FPS'de gerçekleşir. Algoritmanın ikinci aşaması, derin öğrenme tabanlı uzay-zaman nesne izleme olarak tanımlanır. Evrişimsel sinir ağları (CNN) ve uzun-kısa süreli bellek (LSTM) katmanları, görüntü birleştirmeden sonra elde edilen panoramik video üzerinde birlikte kullanılır. Görüntü verilerinden özellik çıkarmak için son teknoloji CNN algoritmaları vardır. Bu başarının avantajlarından yararlanan bir model oluşturuyoruz. Modelde, uzay-zaman ham veri girdi olarak kullanılır ve ilgi bölgesi (ROI) koordinatları regresyon problemi olarak eğitilir. ROI bize panoramik videodan yayınlanacak alanı gösterir. Eğitimde birleştirilmiş videolar bu prosedür için özel yazılmış bir yazılım ile insan operatörler tarafından etiketlenir. Deneysel sonuçlar, önerilen sistemin oyunculara ve topa odaklanarak futbol oyunlarını otomatik olarak çekebildiğini ve tıpkı bir insan kameraman gibi ROI'yi sorunsuz bir şekilde değiştirdiğini gösterir.

Özet (Çeviri)

In this thesis we propose a video shooting system that can broadcast a soccer game autonomously with a robust algorithm. The captured videos from two cameras are stitched in real-time using a standard equipment. Instead of the traditional methods used during image stitching, ArUco markers are used in order to produce a map from the original images to warped images. In this thesis, we use chArUco board which is created with using ArUco markers in order to match pixel coordinates between original image and warped image. In this way, the whole stitching pipeline becomes a single pixel mapping operation. The stitching process with two 4k videos takes place at 36 FPS when using standard equipment. The second stage of the algorithm is defined as deep-learning based space-time object tracking. Convolutional neural network (CNN) and long sort-term memory (LSTM) layers are used together in order to feature extraction and establish time relationship on the panoramic video obtained after stitching. There are several state-of-art CNN algorithms for feature extraction from image data. We build a model that takes advantages of this success. In the model, spatio-temporal raw data is used as an input and region of interest (ROI) coordinates trained as regression problem. The ROI shows us the area which will be broadcast from panoramic video. In training, the stitched videos are labeled by human operators with software which is specialized for this procedure. The experimental results show that the proposed system shoots the soccer games by focusing on the players and the ball autonomously and smoothly changes ROI just like an human cameraman.

Benzer Tezler

  1. Ağ kaynaklarını verimli kullanan bir video gözetleme sistem mimarisi

    A video surveillance system architecture that uses network resources efficiently

    BURCU URAL

    Yüksek Lisans

    Türkçe

    Türkçe

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolEge Üniversitesi

    Uluslararası Bilgisayar Ana Bilim Dalı

    DOÇ. DR. MÜGE SAYIT

  2. Automatic captioning translation: Human names

    Otomatik altyazı çevirisi: İnsan isimleri

    İHSAN ONUR YİĞİT

    Yüksek Lisans

    İngilizce

    İngilizce

    2021

    Mütercim-TercümanlıkHacettepe Üniversitesi

    Mütercim Tercümanlık Ana Bilim Dalı

    PROF. DR. AYMİL DOĞAN

  3. Impact of quality distortions on CNN image classifiers and restoration using deep convolutional auto-encoder

    Kalite bozulmalarının sınıflandırıcı CNN'ler üzerindeki etkileri ve derin konvolüsyonel auto-encoder ile düzeltilmesi

    ÇAĞKAN ÇİLOĞLU

    Yüksek Lisans

    İngilizce

    İngilizce

    2018

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBahçeşehir Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. TAŞKIN KOÇAK

  4. Hybrid deep multi-criteria recommender system model

    Hibrit derin çok kriterli öneri sistemi modeli

    ABDULRAHMAN ALNAHHAS

    Yüksek Lisans

    İngilizce

    İngilizce

    2021

    Endüstri ve Endüstri Mühendisliğiİstanbul Teknik Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    PROF. DR. YUSUF İLKER TOPCU

  5. Adaptive P2P streaming with application to multi-view video

    Çoklu görüntülü video uygulaması ile adaptif P2P akıtımı

    CİHAT GÖKTUĞ GÜRLER

    Doktora

    İngilizce

    İngilizce

    2013

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKoç Üniversitesi

    Elektrik Mühendisliği Ana Bilim Dalı

    PROF. DR. A. MURAT TEKALP