Robust quality metrics for assessing multimodal data

Çok kipli veri değerlendirme için dayanıklı nitelik ölçütleri

PDF İndir

Tez No: 416400
Yazar: BARIŞ KONUK
Danışmanlar: PROF. DR. GÖZDE AKAR
Tez Türü: Doktora
Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
Anahtar Kelimeler: Belirtilmemiş.
Yıl: 2015
Dil: İngilizce
Üniversite: Orta Doğu Teknik Üniversitesi
Enstitü: Fen Bilimleri Enstitüsü
Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
Bilim Dalı: Belirtilmemiş.
Sayfa Sayısı: 144

Özet

Bu tez çalışmasında; kodlama ve iletim tabanlı bozulmalar karşısında algılanan video kalitesini kestirmek için yeni, gürbüz, nesnel referanssız,“Uzam-Zamansal Ağ farkında Video Kalite Metriği”(UZA-VKM) isimli bir video kalite değerlendirme (VKD) metriği önerilmiştir. UZA-VKM, uzamsal karmaşıklık ve hareket gibi videonun uzam-zamansal karakteristiğini yansıtan parametreler kullanır. UZA-VKM, aynı zamanda bit hızı ve paket kayıp oranı gibi kodlama ve iletim tabanlı bozulmaları temsil eden parametreler kullanır. UZA-VKM, Austin'deki Texas Üniversitesi'ne ait Görüntü ve Video Mühendisliği Laboratuarı (LIVE) VKD veri tabanında eğitilmiştir. UZA-VKM; LIVE, Ecole Politechnique Federale de Lausanne (EPFL)- Politecnico di Milano (PoliMI) ve Instituto de Telecomunicacoes, Instituto Superior Tecnico (IT-IST) VKD veri tabanları ile Plymouth Üniversitesi Odyovizüel kalite değerlendirme (OVKD) veri tabanındaki videolarda değerlendirilmiştir. UZA-VKM'nin algılanan video kalitesini; çeşitli video içeriği, video kodlayıcı, uzamsal çözünürlük, bit hızı, çerçeve hızı, paket kaybı vb. içeren bu veri tabanlarında doğrulukla tahmin ettiği kanıtlanmıştır. Mevcut en gelişkin VKD metriklerle karşılaştırma, UZA-VKM'nin umut verici sonuçlar sağladığını işaret etmektedir. Buna ek olarak; kodlama ve iletim tabanlı bozulmalar karşısında algılanan ses kalitesini tahmin etmek amacıyla yeni, nesnel referanssız ses kalite değerlendirme (SKD) metriği geliştirilmiştir. Önerilen SKD metriği, algılanan ses kalitesine örnekleme frekansı, bit hızı ve paket kayıp oranı gibi parametrelere dayanarak değer biçer. Önerilen SKD metriği iki farklı SKD veri tabanında eğitilmiş ve değerlendirilmiştir. SKD metriğin, farklı ses kodlama çeşitlerine sahip bu SKD veri tabanlarında algılanan ses kalitesine güvenilir bir şekilde değer biçtiği gösterilmiştir. Son olarak, literatürdeki klasik yaklaşımı uygulayarak (algılanan video kalite kestirimi, algılanan ses kalite kestirimi ve bu ifadelerin çarpımlarını birleştirerek) nesnel referanssız,“Doğrudan OdyoVizüel Kalite Değerlendirme”(DOVKD) isimli bir OVKD metrik elde edilmiştir. Ayrıca, videoları uzam-zamansal karakteristiklerine göre sınıflandıran yeni bir video sınıflandırma yöntemi tanıtılmıştır. Bu uzam-zamansal tabanlı video sınıflandırma yöntemi kullanılarak,“İçerik Bağımlı OdyoVizüel Kalite Değerlendirme”(İBOVKD) isimli yeni, içerik-bağımlı bir OVKD algoritması tasarlanmıştır. Plymouth Üniversitesi OVKD veri tabanındaki odyovizüel veri için, İBOVKD modelinin DOVKD modelinden daha doğru olduğu gösterilmiştir.

Özet (Çeviri)

In this thesis work; a novel, robust, objective, no-reference video quality assessment (VQA) metric, namely Spatio-Temporal Network aware Video Quality Metric (STN-VQM), has been proposed for estimating perceived video quality under compression and transmission distortions. STN-VQM uses parameters reflecting the spatiotemporal characteristics of the video such as spatial complexity and motion. STN-VQM also utilizes parameters representing distortions due to compression and transmission such as bit rate and packet loss ratio. STN-VQM has been trained on the Laboratory of Image and Video Engineering (LIVE) VQA database, owned by University of Texas at Austin, and evaluated on LIVE, Ecole Politechnique Federale de Lausanne (EPFL)- Politecnico di Milano (PoliMI) and Instituto de Telecomunicacoes, Instituto Superior Tecnico (IT-IST) VQA databases and also on video streams in University of Plymouth audiovisual quality assessment (AVQA) database. STN-VQM is proven to predict perceived video quality accurately on these databases, which span a wide range of video contents, video codecs, spatial resolutions, bit rates, frame rates, packet losses etc. Comparison to the existing state-of-the-art VQA metrics indicates that the STN-VQM provides promising results. Moreover, a novel, objective, no-reference audio quality assessment (AQA) metric has been introduced in order to predict perceived audio quality under compression and transmission distortions. Proposed AQA metric appraises perceived audio quality based on parameters such as sampling frequency, bit rate and packet loss ratio. Proposed AQA metric has been trained and evaluated on two different AQA databases. The AQA metric is shown to appraise perceived audio quality reliably on these AQA databases, which have different audio encoding types. Finally, an objective, no-reference AVQA metric (namely, Direct AudioVisual Quality Assessment – DAVQA) has been obtained by applying the classical approach in the literature, i.e., by combining perceived video quality estimate, perceived audio quality estimate and their product. Moreover, a novel video classification method which classifies videos according to their spatio-temporal characteristics has been developed. Using this spatio-temporal based video classification method, a novel, content-dependent AVQA algorithm (namely Content Dependent AudioVisual Quality Assessment – CDAVQA) has been designed. The CDAVQA model is shown to be more accurate than the DAVQA model on the audiovisual data in the University of Plymouth AVQA database.

Benzer Tezler

Tez No
900268
Measuring and evaluating the maintainability of microservices
Mikroservislerin sürdürülebilirliğinin ölçülmesi ve değerlendirilmesi
RAHİME YILMAZ
Doktora
İngilizce
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol İstanbul Teknik Üniversitesi
Bilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. FEZA BUZLUCA
Tez No
947304
Makine öğrenme algoritmaları ile su tüketim miktarlarının tahmini: Kocaeli örneği
Estimation of water consumption amounts using machine learning algorithms: The case study of Kocaeli
KASIM GÖRENEKLİ
Doktora
Türkçe
2025
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol Sakarya Üniversitesi
Bilişim Sistemleri Ana Bilim Dalı
DOÇ. DR. ALİ GÜLBAĞ
Tez No
876927
Learning to reconstruct intensity images from events
Olaylardan yeğinlik görüntüleri geriçatmayı öğrenmek
BURAK ERCAN
Doktora
İngilizce
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol Hacettepe Üniversitesi
Bilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. MEHMET ERKUT ERDEM
DOÇ. DR. İBRAHİM AYKUT ERDEM
Tez No
956336
Emlak fotoğraflarının kalite değerlendirilmesi: Derin öğrenme tabanlı bir yaklaşım
Quality assessment of real estate photographs: A deep learning-based approach
AKIN YAŞAR
Yüksek Lisans
Türkçe
2025
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol Sakarya Üniversitesi
Bilgisayar ve Bilişim Mühendisliği Ana Bilim Dalı
DR. YÜKSEL YURTAY
Tez No
855235
Integrated multi-scenario geostatistical analysis of groundwater quality in Iran's Gavkhuni watershed
İran'ın Gavkhuni havzasında yeraltı suyu kalitesinin entegre çok-senaryolu jeoistatistiksel analizi
ELNAZ HATAMI BAHMAN BEYGLOO
Doktora
İngilizce
2024
Ziraat Çukurova Üniversitesi
Tarımsal Yapılar ve Sulama Ana Bilim Dalı
PROF. DR. BÜLENT ÖZEKİCİ

Geri Dön