Geri Dön

Robust quality metrics for assessing multimodal data

Çok kipli veri değerlendirme için dayanıklı nitelik ölçütleri

  1. Tez No: 416400
  2. Yazar: BARIŞ KONUK
  3. Danışmanlar: PROF. DR. GÖZDE AKAR
  4. Tez Türü: Doktora
  5. Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2015
  8. Dil: İngilizce
  9. Üniversite: Orta Doğu Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 144

Özet

Bu tez çalışmasında; kodlama ve iletim tabanlı bozulmalar karşısında algılanan video kalitesini kestirmek için yeni, gürbüz, nesnel referanssız,“Uzam-Zamansal Ağ farkında Video Kalite Metriği”(UZA-VKM) isimli bir video kalite değerlendirme (VKD) metriği önerilmiştir. UZA-VKM, uzamsal karmaşıklık ve hareket gibi videonun uzam-zamansal karakteristiğini yansıtan parametreler kullanır. UZA-VKM, aynı zamanda bit hızı ve paket kayıp oranı gibi kodlama ve iletim tabanlı bozulmaları temsil eden parametreler kullanır. UZA-VKM, Austin'deki Texas Üniversitesi'ne ait Görüntü ve Video Mühendisliği Laboratuarı (LIVE) VKD veri tabanında eğitilmiştir. UZA-VKM; LIVE, Ecole Politechnique Federale de Lausanne (EPFL)- Politecnico di Milano (PoliMI) ve Instituto de Telecomunicacoes, Instituto Superior Tecnico (IT-IST) VKD veri tabanları ile Plymouth Üniversitesi Odyovizüel kalite değerlendirme (OVKD) veri tabanındaki videolarda değerlendirilmiştir. UZA-VKM'nin algılanan video kalitesini; çeşitli video içeriği, video kodlayıcı, uzamsal çözünürlük, bit hızı, çerçeve hızı, paket kaybı vb. içeren bu veri tabanlarında doğrulukla tahmin ettiği kanıtlanmıştır. Mevcut en gelişkin VKD metriklerle karşılaştırma, UZA-VKM'nin umut verici sonuçlar sağladığını işaret etmektedir. Buna ek olarak; kodlama ve iletim tabanlı bozulmalar karşısında algılanan ses kalitesini tahmin etmek amacıyla yeni, nesnel referanssız ses kalite değerlendirme (SKD) metriği geliştirilmiştir. Önerilen SKD metriği, algılanan ses kalitesine örnekleme frekansı, bit hızı ve paket kayıp oranı gibi parametrelere dayanarak değer biçer. Önerilen SKD metriği iki farklı SKD veri tabanında eğitilmiş ve değerlendirilmiştir. SKD metriğin, farklı ses kodlama çeşitlerine sahip bu SKD veri tabanlarında algılanan ses kalitesine güvenilir bir şekilde değer biçtiği gösterilmiştir. Son olarak, literatürdeki klasik yaklaşımı uygulayarak (algılanan video kalite kestirimi, algılanan ses kalite kestirimi ve bu ifadelerin çarpımlarını birleştirerek) nesnel referanssız,“Doğrudan OdyoVizüel Kalite Değerlendirme”(DOVKD) isimli bir OVKD metrik elde edilmiştir. Ayrıca, videoları uzam-zamansal karakteristiklerine göre sınıflandıran yeni bir video sınıflandırma yöntemi tanıtılmıştır. Bu uzam-zamansal tabanlı video sınıflandırma yöntemi kullanılarak,“İçerik Bağımlı OdyoVizüel Kalite Değerlendirme”(İBOVKD) isimli yeni, içerik-bağımlı bir OVKD algoritması tasarlanmıştır. Plymouth Üniversitesi OVKD veri tabanındaki odyovizüel veri için, İBOVKD modelinin DOVKD modelinden daha doğru olduğu gösterilmiştir.

Özet (Çeviri)

In this thesis work; a novel, robust, objective, no-reference video quality assessment (VQA) metric, namely Spatio-Temporal Network aware Video Quality Metric (STN-VQM), has been proposed for estimating perceived video quality under compression and transmission distortions. STN-VQM uses parameters reflecting the spatiotemporal characteristics of the video such as spatial complexity and motion. STN-VQM also utilizes parameters representing distortions due to compression and transmission such as bit rate and packet loss ratio. STN-VQM has been trained on the Laboratory of Image and Video Engineering (LIVE) VQA database, owned by University of Texas at Austin, and evaluated on LIVE, Ecole Politechnique Federale de Lausanne (EPFL)- Politecnico di Milano (PoliMI) and Instituto de Telecomunicacoes, Instituto Superior Tecnico (IT-IST) VQA databases and also on video streams in University of Plymouth audiovisual quality assessment (AVQA) database. STN-VQM is proven to predict perceived video quality accurately on these databases, which span a wide range of video contents, video codecs, spatial resolutions, bit rates, frame rates, packet losses etc. Comparison to the existing state-of-the-art VQA metrics indicates that the STN-VQM provides promising results. Moreover, a novel, objective, no-reference audio quality assessment (AQA) metric has been introduced in order to predict perceived audio quality under compression and transmission distortions. Proposed AQA metric appraises perceived audio quality based on parameters such as sampling frequency, bit rate and packet loss ratio. Proposed AQA metric has been trained and evaluated on two different AQA databases. The AQA metric is shown to appraise perceived audio quality reliably on these AQA databases, which have different audio encoding types. Finally, an objective, no-reference AVQA metric (namely, Direct AudioVisual Quality Assessment – DAVQA) has been obtained by applying the classical approach in the literature, i.e., by combining perceived video quality estimate, perceived audio quality estimate and their product. Moreover, a novel video classification method which classifies videos according to their spatio-temporal characteristics has been developed. Using this spatio-temporal based video classification method, a novel, content-dependent AVQA algorithm (namely Content Dependent AudioVisual Quality Assessment – CDAVQA) has been designed. The CDAVQA model is shown to be more accurate than the DAVQA model on the audiovisual data in the University of Plymouth AVQA database.

Benzer Tezler

  1. Measuring and evaluating the maintainability of microservices

    Mikroservislerin sürdürülebilirliğinin ölçülmesi ve değerlendirilmesi

    RAHİME YILMAZ

    Doktora

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. FEZA BUZLUCA

  2. Learning to reconstruct intensity images from events

    Olaylardan yeğinlik görüntüleri geriçatmayı öğrenmek

    BURAK ERCAN

    Doktora

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHacettepe Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. MEHMET ERKUT ERDEM

    DOÇ. DR. İBRAHİM AYKUT ERDEM

  3. Integrated multi-scenario geostatistical analysis of groundwater quality in Iran's Gavkhuni watershed

    İran'ın Gavkhuni havzasında yeraltı suyu kalitesinin entegre çok-senaryolu jeoistatistiksel analizi

    ELNAZ HATAMI BAHMAN BEYGLOO

    Doktora

    İngilizce

    İngilizce

    2024

    ZiraatÇukurova Üniversitesi

    Tarımsal Yapılar ve Sulama Ana Bilim Dalı

    PROF. DR. BÜLENT ÖZEKİCİ

  4. Application of robust statistics on a crude distillation unit

    Ham petrol destilasyon ünitesinde sağlam istatistiklerin uygulanması

    SİNEM NALBANT KURŞUN

    Yüksek Lisans

    İngilizce

    İngilizce

    2017

    Kimya MühendisliğiBoğaziçi Üniversitesi

    Kimya Mühendisliği Ana Bilim Dalı

    DOÇ. DR. BURAK ALAKENT

  5. Software defect prediction performance monitoring of deep and machine learning models on NASA promise datasets

    NASA promise veri setlerinde derin ve makine öğrenme modellerinin yazılım hata tahmini performansının izlenmesi

    ABDULLAH AKRAM SHAKIR AL BAYATI

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAltınbaş Üniversitesi

    Elektrik ve Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. SEFER KURNAZ