Two-level temporal relation model for video instance segmentation
Video örnek segmentasyonu için iki seviyeli ilişki modeli
- Tez No: 774186
- Danışmanlar: DR. ÖĞR. ÜYESİ FATMA GÜNEY
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2022
- Dil: İngilizce
- Üniversite: Koç Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 50
Özet
Videolarda obje tespiti, segmentasyonu ve takibi alanında mevcut yaklaşımlar ya tüm videoyu girdi olarak alıp çevrimdışı olarak işleyerek sonuçların kalitesine odaklanmakta; ya da kare kare işleyerek performastan feragat ederek hıza odaklanmaktadır. Bu çalışmada, çevrimdışı muadillerinin performansı ile yakın olan bir çevrimiçi yöntem öneriyoruz. Bu yöntemde özgün olarak nesneleri kodlayan ve onları zaman içinde ilişkilendiren, mesaj ileten bir grafik sinir ağı sunuyoruz. Ayrıca modelimizi, özellik piramidi ağındaki özellikleri artık bağlantılarla birleştirmek için yeni bir modül ile güçlendiriyoruz. Uçtan uca eğitilmiş modelimiz, çevrimiçi yöntemler dahilinde YouTube-VIS veri setinde muadil modeller arasında en iyi performansı elde etti. DAVIS üzerinde yapılan diğer deneyler, modelimizin video nesnesi bölümleme görevine genelleme kabiliyetini göstermektedir. Ayrıca otonom sürüş ayarı konusundaki çalışmalarımızı değerlendiriyor ve KITTI MOTS veri setinde karşılaştırılabilir sonuçlar gösteriyoruz.
Özet (Çeviri)
In Video Instance Segmentation (VIS), current approaches either focus on the quality of the results, by taking the whole video as input and processing it offline; or on speed, by handling it frame by frame at the cost of competitive performance. In this work, we propose an online method that is on par with the performance of the offline counterparts. We introduce a message-passing graph neural network that encodes objects and relates them through time. We additionally propose a novel module to fuse features from the feature pyramid network with residual connections. Our model, trained end-to-end, achieves state-of-the-art performance on the YouTube-VIS dataset within the online methods. Further experiments on DAVIS demonstrate the generalization capability of our model to the video object segmentation task. We also evaluate our work on autonomous driving setting and show comparable results in KITTI MOTS dataset.
Benzer Tezler
- HDTV işaretlerinin uydu üzerinden iletiminde özel problemler
Special problems in transmitting the HDTV signals by satellite
RAMAZAN BAL
Yüksek Lisans
Türkçe
1991
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiPROF.DR. BİNGÜL YAZGAN
- Enabling dynamics in face analysis
Başlık çevirisi yok
HAMDİ DİBEKLİOĞLU
Doktora
İngilizce
2014
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolUniversiteit van AmsterdamPROF. DR. THEO GEVERS
PROF. DR. A. W. M. SMEULDERS
- Holistic representations for activities and crowd behaviors
Başlık çevirisi yok
BERKAN SOLMAZ
Doktora
İngilizce
2013
Elektrik ve Elektronik MühendisliğiUniversity of Central FloridaDR. MUBARAK SHAH
- Bütünleşik kent bilgi sistemlerine yönelik ulusal konumsal 3 boyutlu veri standartlarının geliştirilmesi
Development of national spatial 3 dimensional geo-data standards for integrated urban information systems
SERPİL ATEŞ AYDAR
Doktora
Türkçe
2023
Jeodezi ve Fotogrametriİstanbul Teknik ÜniversitesiGeomatik Mühendisliği Ana Bilim Dalı
PROF. DR. TAHSİN YOMRALIOĞLU
- Energy aware endurance framework for mission critical aerial networks
Güdümlü havasal ağlar için enerji farkında endürans modeli
YUSUF ÖZÇEVİK
Doktora
İngilizce
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. BERK CANBERK