Geri Dön

Model based multiple audio sequence alignment

Model bazlı çoklu ses dizisi hizalaması

  1. Tez No: 409263
  2. Yazar: DOĞAÇ BAŞARAN
  3. Danışmanlar: PROF. DR. EMİN ANARIM, DOÇ. DR. ALİ TAYLAN CEMGİL
  4. Tez Türü: Doktora
  5. Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2015
  8. Dil: İngilizce
  9. Üniversite: Boğaziçi Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 134

Özet

Akıllı telefonlar gibi kayıt yapabilen cihazların artması ile aynı olayın çok sayıda kişi tarafından kayıt edilmesi, günümüzde gittikçe artan bir durum olmaktadır. Uygun hizalandığı takdirde bu kayıtlar, yenileme, yeniden birleştirme ve uyarlama gibi alanlarda çeşitli uygulamalarda kullanılabilecek, aynı sahneye çeşitli görsel ve işitsel açılar sağlayacaktır. Bu çalışmada, birbiri ile uyumsuz (hizalı olmayan) çoklu işitsel dizileri hizalama sorunu olasılıksal çerçevede yorumlanmış ve bu bağlamda şablon bir üretimsel model tanımlanarak model tabanlı özgün bir yaklaşım öne sürülmüştür. Bu şablonu kullanarak hemen hemen tüm öznitelik çeşitlerini (gerçek değerli, pozitif, ikili, kategorisel) temelde kapsayan 6 farklı üretimsel model tanımlanmıştır. Bu modellerden hizalamanın kalitesini ölçen uygun puanlama fonksiyonları türetilmiştir. Bu fonksiyonlar dizilerin örtüşmediği durumlarda hizalamaları ve tek bir parçanın önceden hizalanmış parçalara karşı hizalanmasını değerlendirebilmektedirler. Puanlama veya maliyet fonksiyonları tanımlandıktan sonra, bu fonksiyonların oluşturduğu yüzeyde en iyi hizalamanın bulunması için buluşsal ardışık bir arama yöntemi ve Gibbs örnekleme yaklaşımı önerilmiştir. Ek olarak bir çoklu çözünürlük hizalama yöntemi önerilmiş, bu yöntemde ardışık Monte Carlo örnekleme ve önerilen ardışık arama yöntemi birleştirilerek özgün bir yaklaşım geliştirilmiştir. Tüm modeller uygun öznitelikler kullanılarak, yapay ve gerçek veri kümeleri ile ayrıntılı olarak değerlendirilmiştir. Deney sonuçları bu yaklaşımın ilinti gibi basit, temel metotların yetersiz kaldığı kısmi örtüşmeler, karmaşık ve zor senaryolarda başarılı olduğunu göstermektedir.

Özet (Çeviri)

It is increasingly more common that an occasion is recorded by multiple individuals with the proliferation of recording devices such as smart phones. When properly aligned, these recordings may provide several audio and visual perspectives to a scene which leads to several applications in restoring, remastering and remixing frameworks in various fields. In this study, we interpret the problem of aligning multiple unsynchronized audio sequences in a probabilistic framework. In this manner, we propose a novel, model based approach where we define a template generative model. We define 6 different generative models using this template covering basically all kinds of features (real valued, positive, binary and categorical). Proper scoring functions that evaluates the quality of an alignment are derived from each model where we are able to penalize non-overlapping alignments and alignment of a single sequence against a pre-aligned sequences. Having defined a cost or score function, a heuristic sequential search algorithm and a Gibbs sampler approach are proposed to find the optimum alignment of sequences on the surfaces defined by derived score functions. In addition we propose a multi resolution alignment algorithm where we combine Sequential Monte Carlo (SMC) samplers and proposed sequential search method. The models and appropriate features are exhaustively evaluated with artificial and real-life data sets. The simulation results suggest that the approach is able to handle difficult, ambiguous scenarios and partial matchings where simple baseline methods such as correlation fail.

Benzer Tezler

  1. The significance and the contribution of 6+1 traits of writing to the success of the students in writing courses in English language teaching

    Yazmanın 6+1 özelliğinin İngilizce öğretiminde yazılı anlatım derslerindeki öğrenci başarısına katkısı ve önemi

    ÖZLEM YAZAR

    Yüksek Lisans

    İngilizce

    İngilizce

    2004

    Eğitim ve ÖğretimGazi Üniversitesi

    İngiliz Dili Eğitimi Ana Bilim Dalı

    YRD. DOÇ. DR. PAŞA TEVFİK CEPHE

  2. ATM'de lan hizmetleri

    ATM-lan services

    İRFAN UĞUR

    Yüksek Lisans

    Türkçe

    Türkçe

    1997

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    PROF. DR. GÜNSEL DURUSOY

  3. Zamanla değişen kanalların kestirimi ve uyarlamalı kodlama

    The Estimation of time varying channels and adaptive coding

    CÜNEYT DELİKTAŞ

    Yüksek Lisans

    Türkçe

    Türkçe

    1997

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ÜMİT AYGÖLÜ

  4. How cryptographic implementations affect mobile agent systems

    Şifreleme gerçekleştirmelerinin gezgin aracı internet sistemlerini nasıl etkilediği

    İSMAİL ULUKUŞ

    Yüksek Lisans

    İngilizce

    İngilizce

    2003

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi Üniversitesi

    Sistem ve Kontrol Mühendisliği Ana Bilim Dalı

    PROF. DR. EMİN ANARIM