Semantic video modeling and retrieval with visual, auditory, textual sources

Görsel, işitsel, yazısal kaynaklarla video modellenmesi ve erişimi

Tez No: 153483
Yazar: NURCAN DURAK
Danışmanlar: PROF. DR. ADNAN YAZICI
Tez Türü: Yüksek Lisans
Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
Anahtar Kelimeler: Çok-biçimli Video Modelleme ve Erişme, İşitsel, Görsel, Yazısal, Uzaysal-Zamansal, Multimodal Video Modeling and Retrieval, Audio, Visual, Textual, Spatio- temporality. IV
Yıl: 2004
Dil: İngilizce
Üniversite: Orta Doğu Teknik Üniversitesi
Enstitü: Fen Bilimleri Enstitüsü
Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
Bilim Dalı: Belirtilmemiş.
Sayfa Sayısı: 108

Özet

oz GÖRSEL, İŞİTSEL, YAZISAL KAYNAKLARLA ANLAMSAL VİDEO MODELLENMESİ ve ERİŞİMİ Durak, Nurcan Yüksek Lisans, Bilgisayar Mühendisliği Bölümü Tez Yöneticisi: Profesör Dr. Adnan Yazıcı Eylül 2004, 95sayfa İçeriğe dayalı video indeksleme ve erişim çalışmaları, videonun içeriğine farklı yönlerden daha etkin ve başarılı bir şekilde ulaşılmasını amaçlar. Çalışmaların çoğu, video içeriğinin modellenmesinde ve erişilmesinde görsel bileşen üzerine yoğunlaşmıştır. Görsel içeriğin yanında diğer medya bileşenleri de değerli bilgiler taşır. Diğer medya bileşenleri video üzerinde ki yazılar, başlıklar, işitsel bilgiler, resimlere eşlik eden konuşmalar olabilir. Bu çalışma videonun anlamsal içeriğini görsel, işitsel ve yazısal bileşenler kullanarak modellemektedir. Görsel alanda, görsel olaylar, görsel nesneler ve görsel nesnelerin uzaysal- zamansal özellikleri çıkartılmıştır. İşitsel alanda, işitsel olaylar ve işitsel nesneler çıkartılmıştır. Yazısal alanda, konuşma metni ve video üzerindeki yazılar göz önüne alınmıştır. Önerdiğimiz modelle, kullanıcılar video içeriğine farklı yönlerden ulaşabilirler ve istedikleri bilgiyi daha çabuk elde ederler. Çok-biçimli yapısının yanında, modelimiz video içeriğini farklı anlamsal katmanlarda sorgulayabilmek için anlamsal hiyerarşiler üzerine kurulmuştur. Görsel alanda sekans-sahne hiyerarşileri, işitsel alanda arkaplan-önplan hiyerarşileri, konuşma alanında da konu hiyerarşileri vardır. Tanıtılan model geliştirilmiş ve çok-biçimli sorgulamalar, hiyerarşik sorgulamalar, bulanık konumsal sorgulamalar, bulanık bölgesel sorgulamalar, bulanık uzaysal-zamansal sorgulamalar, ve zamansal sorgulamalar video içeriği üzerine başarıyla uygulanmıştır.

Özet (Çeviri)

ABSTRACT SEMANTIC VIDEO MODELING AND RETRIEVAL WITH VISUAL, AUDITORY, TEXTUAL SOURCES Durak, Nurcan M.S., Department of Computer Engineering Supervisor: Prof. Dr. Adnan Yazıcı September 2004, 95pages The studies on content-based video indexing and retrieval aim at accessing video content from different aspects more efficiently and effectively. Most of the studies have concentrated on the visual component of video content in modeling and retrieving the video content. Beside visual component, much valuable information is also carried in other media components, such as superimposed text, closed captions, audio, and speech that accompany the pictorial component. In this study, semantic content of video is modeled using visual, auditory, and textual components. In the visual domain, visual events, visual objects, and spatial characteristics of visual objects are extracted. In the auditory domain, auditory events and auditory objects are extracted. In textual domain, speech transcripts and visible texts are considered. With our proposed model, users can access video content from different aspects and get desired information more quickly. Beside multimodality, our model is constituted on semantic hierarchies that enable querying the video content at different semantic levels. There are sequence-scene hierarchies in visual domain, background-foreground hierarchies in auditory domain, and subject hierarchies in speech domain. Presented model has been implemented and multimodal content queries, hierarchical queries, fuzzy spatial queries, fuzzy regional queries, fuzzy spatio-temporal queries, and temporal queries have been applied on video content successfully.

Benzer Tezler

Tez No
129154
A Semantic data model and query language for video databases
Video verileri için anlamsal veri modeli ve sorgulama dili
UMUT ARSLAN
Yüksek Lisans
İngilizce
2002
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol İhsan Doğramacı Bilkent Üniversitesi
Bilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. ÖZGÜR ULUSOY
YRD. DOÇ. DR. UĞUR GÜDÜKBAY
Tez No
129233
Data modeling and querying for video databases
Video veri tabanları için veri modelleme ve sorgulama
MEHMET EMİN DÖNDERLER
Doktora
İngilizce
2002
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol İhsan Doğramacı Bilkent Üniversitesi
Bilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. ÖZGÜR ULUSOY
YRD. DOÇ. DR. UĞUR GÜDÜKBAY
Tez No
340977
Integration of multimodal multimedia database system architecture with query level fusion
Sorgu seviyesinde füzyon destekleyen multimodal çokluortam veri tabanı sistemi mimari entegrasyonu
SAEID SATTARI
Yüksek Lisans
İngilizce
2013
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol Orta Doğu Teknik Üniversitesi
Bilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. ADNAN YAZICI
Tez No
489488
Optical flow based video frame segmentation and segment classification
Optik akış tabanlı video çerçeve bölümlendirme ve bölüm sınıflandırma
SAMET AKPINAR
Doktora
İngilizce
2018
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol Orta Doğu Teknik Üniversitesi
Bilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. FERDANUR ALPASLAN
Tez No
650905
Dense video captioning by utilizing auxiliary image data
Yardımcı resim verilerini kullanarak detaylı video altyazılama
EMRE BORAN
Yüksek Lisans
İngilizce
2020
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol Hacettepe Üniversitesi
Bilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. NAZLI İKİZLER CİNBİŞ
DOÇ. DR. İBRAHİM AYKUT ERDEM

Geri Dön