Model based multiple audio sequence alignment
Model bazlı çoklu ses dizisi hizalaması
- Tez No: 409263
- Danışmanlar: PROF. DR. EMİN ANARIM, DOÇ. DR. ALİ TAYLAN CEMGİL
- Tez Türü: Doktora
- Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2015
- Dil: İngilizce
- Üniversite: Boğaziçi Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 134
Özet
Akıllı telefonlar gibi kayıt yapabilen cihazların artması ile aynı olayın çok sayıda kişi tarafından kayıt edilmesi, günümüzde gittikçe artan bir durum olmaktadır. Uygun hizalandığı takdirde bu kayıtlar, yenileme, yeniden birleştirme ve uyarlama gibi alanlarda çeşitli uygulamalarda kullanılabilecek, aynı sahneye çeşitli görsel ve işitsel açılar sağlayacaktır. Bu çalışmada, birbiri ile uyumsuz (hizalı olmayan) çoklu işitsel dizileri hizalama sorunu olasılıksal çerçevede yorumlanmış ve bu bağlamda şablon bir üretimsel model tanımlanarak model tabanlı özgün bir yaklaşım öne sürülmüştür. Bu şablonu kullanarak hemen hemen tüm öznitelik çeşitlerini (gerçek değerli, pozitif, ikili, kategorisel) temelde kapsayan 6 farklı üretimsel model tanımlanmıştır. Bu modellerden hizalamanın kalitesini ölçen uygun puanlama fonksiyonları türetilmiştir. Bu fonksiyonlar dizilerin örtüşmediği durumlarda hizalamaları ve tek bir parçanın önceden hizalanmış parçalara karşı hizalanmasını değerlendirebilmektedirler. Puanlama veya maliyet fonksiyonları tanımlandıktan sonra, bu fonksiyonların oluşturduğu yüzeyde en iyi hizalamanın bulunması için buluşsal ardışık bir arama yöntemi ve Gibbs örnekleme yaklaşımı önerilmiştir. Ek olarak bir çoklu çözünürlük hizalama yöntemi önerilmiş, bu yöntemde ardışık Monte Carlo örnekleme ve önerilen ardışık arama yöntemi birleştirilerek özgün bir yaklaşım geliştirilmiştir. Tüm modeller uygun öznitelikler kullanılarak, yapay ve gerçek veri kümeleri ile ayrıntılı olarak değerlendirilmiştir. Deney sonuçları bu yaklaşımın ilinti gibi basit, temel metotların yetersiz kaldığı kısmi örtüşmeler, karmaşık ve zor senaryolarda başarılı olduğunu göstermektedir.
Özet (Çeviri)
It is increasingly more common that an occasion is recorded by multiple individuals with the proliferation of recording devices such as smart phones. When properly aligned, these recordings may provide several audio and visual perspectives to a scene which leads to several applications in restoring, remastering and remixing frameworks in various fields. In this study, we interpret the problem of aligning multiple unsynchronized audio sequences in a probabilistic framework. In this manner, we propose a novel, model based approach where we define a template generative model. We define 6 different generative models using this template covering basically all kinds of features (real valued, positive, binary and categorical). Proper scoring functions that evaluates the quality of an alignment are derived from each model where we are able to penalize non-overlapping alignments and alignment of a single sequence against a pre-aligned sequences. Having defined a cost or score function, a heuristic sequential search algorithm and a Gibbs sampler approach are proposed to find the optimum alignment of sequences on the surfaces defined by derived score functions. In addition we propose a multi resolution alignment algorithm where we combine Sequential Monte Carlo (SMC) samplers and proposed sequential search method. The models and appropriate features are exhaustively evaluated with artificial and real-life data sets. The simulation results suggest that the approach is able to handle difficult, ambiguous scenarios and partial matchings where simple baseline methods such as correlation fail.
Benzer Tezler
- The significance and the contribution of 6+1 traits of writing to the success of the students in writing courses in English language teaching
Yazmanın 6+1 özelliğinin İngilizce öğretiminde yazılı anlatım derslerindeki öğrenci başarısına katkısı ve önemi
ÖZLEM YAZAR
Yüksek Lisans
İngilizce
2004
Eğitim ve ÖğretimGazi Üniversitesiİngiliz Dili Eğitimi Ana Bilim Dalı
YRD. DOÇ. DR. PAŞA TEVFİK CEPHE
- ATM'de lan hizmetleri
ATM-lan services
İRFAN UĞUR
Yüksek Lisans
Türkçe
1997
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
PROF. DR. GÜNSEL DURUSOY
- Zamanla değişen kanalların kestirimi ve uyarlamalı kodlama
The Estimation of time varying channels and adaptive coding
CÜNEYT DELİKTAŞ
Yüksek Lisans
Türkçe
1997
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
DOÇ. DR. ÜMİT AYGÖLÜ
- Music retrieval systems: Robust performance under the effect of uncertainty
Başlık çevirisi yok
ERDEM ÜNAL
Doktora
İngilizce
2008
Elektrik ve Elektronik MühendisliğiUniversity of Southern CaliforniaDR. SHRIKANTH NARAYANAN
- How cryptographic implementations affect mobile agent systems
Şifreleme gerçekleştirmelerinin gezgin aracı internet sistemlerini nasıl etkilediği
İSMAİL ULUKUŞ
Yüksek Lisans
İngilizce
2003
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi ÜniversitesiSistem ve Kontrol Mühendisliği Ana Bilim Dalı
PROF. DR. EMİN ANARIM