Robust quality metrics for assessing multimodal data
Çok kipli veri değerlendirme için dayanıklı nitelik ölçütleri
- Tez No: 416400
- Danışmanlar: PROF. DR. GÖZDE AKAR
- Tez Türü: Doktora
- Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2015
- Dil: İngilizce
- Üniversite: Orta Doğu Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 144
Özet
Bu tez çalışmasında; kodlama ve iletim tabanlı bozulmalar karşısında algılanan video kalitesini kestirmek için yeni, gürbüz, nesnel referanssız,“Uzam-Zamansal Ağ farkında Video Kalite Metriği”(UZA-VKM) isimli bir video kalite değerlendirme (VKD) metriği önerilmiştir. UZA-VKM, uzamsal karmaşıklık ve hareket gibi videonun uzam-zamansal karakteristiğini yansıtan parametreler kullanır. UZA-VKM, aynı zamanda bit hızı ve paket kayıp oranı gibi kodlama ve iletim tabanlı bozulmaları temsil eden parametreler kullanır. UZA-VKM, Austin'deki Texas Üniversitesi'ne ait Görüntü ve Video Mühendisliği Laboratuarı (LIVE) VKD veri tabanında eğitilmiştir. UZA-VKM; LIVE, Ecole Politechnique Federale de Lausanne (EPFL)- Politecnico di Milano (PoliMI) ve Instituto de Telecomunicacoes, Instituto Superior Tecnico (IT-IST) VKD veri tabanları ile Plymouth Üniversitesi Odyovizüel kalite değerlendirme (OVKD) veri tabanındaki videolarda değerlendirilmiştir. UZA-VKM'nin algılanan video kalitesini; çeşitli video içeriği, video kodlayıcı, uzamsal çözünürlük, bit hızı, çerçeve hızı, paket kaybı vb. içeren bu veri tabanlarında doğrulukla tahmin ettiği kanıtlanmıştır. Mevcut en gelişkin VKD metriklerle karşılaştırma, UZA-VKM'nin umut verici sonuçlar sağladığını işaret etmektedir. Buna ek olarak; kodlama ve iletim tabanlı bozulmalar karşısında algılanan ses kalitesini tahmin etmek amacıyla yeni, nesnel referanssız ses kalite değerlendirme (SKD) metriği geliştirilmiştir. Önerilen SKD metriği, algılanan ses kalitesine örnekleme frekansı, bit hızı ve paket kayıp oranı gibi parametrelere dayanarak değer biçer. Önerilen SKD metriği iki farklı SKD veri tabanında eğitilmiş ve değerlendirilmiştir. SKD metriğin, farklı ses kodlama çeşitlerine sahip bu SKD veri tabanlarında algılanan ses kalitesine güvenilir bir şekilde değer biçtiği gösterilmiştir. Son olarak, literatürdeki klasik yaklaşımı uygulayarak (algılanan video kalite kestirimi, algılanan ses kalite kestirimi ve bu ifadelerin çarpımlarını birleştirerek) nesnel referanssız,“Doğrudan OdyoVizüel Kalite Değerlendirme”(DOVKD) isimli bir OVKD metrik elde edilmiştir. Ayrıca, videoları uzam-zamansal karakteristiklerine göre sınıflandıran yeni bir video sınıflandırma yöntemi tanıtılmıştır. Bu uzam-zamansal tabanlı video sınıflandırma yöntemi kullanılarak,“İçerik Bağımlı OdyoVizüel Kalite Değerlendirme”(İBOVKD) isimli yeni, içerik-bağımlı bir OVKD algoritması tasarlanmıştır. Plymouth Üniversitesi OVKD veri tabanındaki odyovizüel veri için, İBOVKD modelinin DOVKD modelinden daha doğru olduğu gösterilmiştir.
Özet (Çeviri)
In this thesis work; a novel, robust, objective, no-reference video quality assessment (VQA) metric, namely Spatio-Temporal Network aware Video Quality Metric (STN-VQM), has been proposed for estimating perceived video quality under compression and transmission distortions. STN-VQM uses parameters reflecting the spatiotemporal characteristics of the video such as spatial complexity and motion. STN-VQM also utilizes parameters representing distortions due to compression and transmission such as bit rate and packet loss ratio. STN-VQM has been trained on the Laboratory of Image and Video Engineering (LIVE) VQA database, owned by University of Texas at Austin, and evaluated on LIVE, Ecole Politechnique Federale de Lausanne (EPFL)- Politecnico di Milano (PoliMI) and Instituto de Telecomunicacoes, Instituto Superior Tecnico (IT-IST) VQA databases and also on video streams in University of Plymouth audiovisual quality assessment (AVQA) database. STN-VQM is proven to predict perceived video quality accurately on these databases, which span a wide range of video contents, video codecs, spatial resolutions, bit rates, frame rates, packet losses etc. Comparison to the existing state-of-the-art VQA metrics indicates that the STN-VQM provides promising results. Moreover, a novel, objective, no-reference audio quality assessment (AQA) metric has been introduced in order to predict perceived audio quality under compression and transmission distortions. Proposed AQA metric appraises perceived audio quality based on parameters such as sampling frequency, bit rate and packet loss ratio. Proposed AQA metric has been trained and evaluated on two different AQA databases. The AQA metric is shown to appraise perceived audio quality reliably on these AQA databases, which have different audio encoding types. Finally, an objective, no-reference AVQA metric (namely, Direct AudioVisual Quality Assessment – DAVQA) has been obtained by applying the classical approach in the literature, i.e., by combining perceived video quality estimate, perceived audio quality estimate and their product. Moreover, a novel video classification method which classifies videos according to their spatio-temporal characteristics has been developed. Using this spatio-temporal based video classification method, a novel, content-dependent AVQA algorithm (namely Content Dependent AudioVisual Quality Assessment – CDAVQA) has been designed. The CDAVQA model is shown to be more accurate than the DAVQA model on the audiovisual data in the University of Plymouth AVQA database.
Benzer Tezler
- Measuring and evaluating the maintainability of microservices
Mikroservislerin sürdürülebilirliğinin ölçülmesi ve değerlendirilmesi
RAHİME YILMAZ
Doktora
İngilizce
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. FEZA BUZLUCA
- Learning to reconstruct intensity images from events
Olaylardan yeğinlik görüntüleri geriçatmayı öğrenmek
BURAK ERCAN
Doktora
İngilizce
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHacettepe ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. MEHMET ERKUT ERDEM
DOÇ. DR. İBRAHİM AYKUT ERDEM
- Integrated multi-scenario geostatistical analysis of groundwater quality in Iran's Gavkhuni watershed
İran'ın Gavkhuni havzasında yeraltı suyu kalitesinin entegre çok-senaryolu jeoistatistiksel analizi
ELNAZ HATAMI BAHMAN BEYGLOO
Doktora
İngilizce
2024
ZiraatÇukurova ÜniversitesiTarımsal Yapılar ve Sulama Ana Bilim Dalı
PROF. DR. BÜLENT ÖZEKİCİ
- Application of robust statistics on a crude distillation unit
Ham petrol destilasyon ünitesinde sağlam istatistiklerin uygulanması
SİNEM NALBANT KURŞUN
Yüksek Lisans
İngilizce
2017
Kimya MühendisliğiBoğaziçi ÜniversitesiKimya Mühendisliği Ana Bilim Dalı
DOÇ. DR. BURAK ALAKENT
- Software defect prediction performance monitoring of deep and machine learning models on NASA promise datasets
NASA promise veri setlerinde derin ve makine öğrenme modellerinin yazılım hata tahmini performansının izlenmesi
ABDULLAH AKRAM SHAKIR AL BAYATI
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAltınbaş ÜniversitesiElektrik ve Bilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. SEFER KURNAZ