Geri Dön

Localization of multiple sound sources in three dimensional environments

Üç boyutlu ortamlarda bulunan çok sayıdaki ses kaynağının yerlerinin tespiti

  1. Tez No: 196848
  2. Yazar: MURAT ENGİN ÜNAL
  3. Danışmanlar: PROF. DR. FİKRET GÜRGEN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2006
  8. Dil: İngilizce
  9. Üniversite: Boğaziçi Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Sistem ve Kontrol Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 56

Özet

Ses kaynağı yeri belirlenmesinin telekonferans, konuşma tanıma, konuşmacı belirleme, otomotiv ortamında konuşma sinyali alma, yankılı ortamlarda ses yakalama,büyük odalarda ses kaydı ve işitme cihazı tasarlama gibi birçok uygulaması bulunmaktadır.Ses kaynağının yerini bulmanın bir yolu geliş yönü değerlerini kullanmaktır. Bu değer,mikrofon dizisinin orta noktası ve ses kaynağı arasındaki doğru ile mikrofon dizisinitaşıyan doğru arasındaki açıyı ifade etmektedir. Geliş yönü değerleri genellikle, ilk olarakiki farklı mikrofon tarafından algılanan sinyallerin geliş zaman gecikmesi değerlerinintahmin edilmesi, sonra da bu değerin diğerine dönüştürülmesi ile belirlenir. Geliş zamangecikmesi değeri ise çapraz-güç tayfı fazı katsayıları ile tahmin edilir.Bu tezde, üç boyutlu ortamlarda bulunan çok sayıdaki ses kaynağının yerlerini tespitedebilecek yeni bir yöntem önerilmiştir. İlk olarak, CSP katsayılarının eşzamanlı birbiçimde toplanması yöntemi ile DOA tahminleri bulunmuştur. Daha sonra bu tahminler,mikrofon dizisi tasarımına bağlı olarak çalışan ve bir tutarsızlık ölçüsünü esas alan yeni biryaklaşımla gruplandırılmıştır. Her bir ses kaynağı için DOA tahmini üçlüleri bulunduktansonra bunların yerleri üç koninin kesişim noktalarını bulmak için geliştirilen, tek değişkenebağlı bir fonksiyon üzerinde çalışan bir arama metodu yardımıyla bulunur.Ortamda birden fazla ses kaynağının bulunması bu probleme iki zorlukgetirmektedir. Birincisi, ses kaynakları arasındaki ilgileşimin geliş zamanı değerlerinintahmini sürecini saptırması, İkincisi ise, tüm kesişim noktaları arasından doğru kesişimleribulmak için çoklu mikrofon dizileri tarafından hesaplanan çoklu geliş yönü tahminlerininses kaynakları ile eşleştirilmesi zorunluluğudur. Bir başka önemli zorluk ise ortamın üçboyuta genellenmiş olmasıdır.viiDeneyler hem benzetim hem de gerçek akustik ortamda gerçekleştirilmiştir.Sonuçlar, algoritmanın karşılaştığı karmaşıklıklar, deneylerde kullanılabilen mikrofonsayısı ve bunları çeşitliliği göz önünde bulundurulduğunda oldukça umut vericidir.

Özet (Çeviri)

Localization of sound sources has several applications like teleconferencing, speechrecognition, speaker identification, speech acquisition in an automobile environment,sound capture in reverberant enclosures, large room recording-conferencing, and hearingaid devices. One way of finding the location of a sound source is to utilize the direction ofarrival (DOA) values. This value indicates the angle between two lines, first of whichconnects the mid point of the microphone array and the sound source, and second of whichcarries the microphone array. DOA values are usually estimated by first estimating thetime delay of arrival (TDOA) value of the signals received from two microphones and thenconverting TDOA estimates to DOA estimates. TDOA value is estimated using the cross-power spectrum phase (CSP) coefficients.The existence of multiple sound sources in an environment brings two complicationsto this problem. First of all, the correlation between the sound sources distorts the TDOAestimation procedure. Second, multiple DOA estimates, which are calculated for multiplemicrophone arrays, have to be matched to the sound sources to find the correct intersectionpoints among multiple ones. Another major complication is the generalization of theenvironment to the three dimensional space.In this thesis, a new method is proposed, for localizing multiple sound sources inthree dimensional environments. The synchronous addition of CSP coefficients method isutilized for finding the undistorted DOA estimates. Then these estimates are clusteredusing a new design-specific, an inconsistency measure based clustering algorithm. Havingfound DOA estimate triples for each sound source, the location of sound sources aredetermined by finding the intersection point of three cones formed by three DOA values.This intersection is found by first finding a closed formula, which consists of a singlevvariable, for a locus of the intersection, which is a three dimensional path and then findingthe suitable point on this path.Experiments are done on simulation and real acoustical environments. The results arepromising considering the complexities that the algorithm faced, and the number of themicrophones that are available for the experiments, and the diversity of them.

Benzer Tezler

  1. Mikrofon dizilerinde ses kaynağının yerinin zaman farkı gecikmeleri kullanılarak bulunması

    Sound source localization using microphone arrays by tdoa method

    BİLGE MİNİSKER

    Yüksek Lisans

    Türkçe

    Türkçe

    2018

    Mühendislik Bilimleriİstanbul Teknik Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    DOÇ. MÜRVET KIRCI

  2. Cardiopal: Cardiac passive acoustic localization and mapping using2-D recording of heart sounda

    Başlık çevirisi yok

    YILDIRIM BAHADIRLAR

    Doktora

    İngilizce

    İngilizce

    1997

    BiyomühendislikBoğaziçi Üniversitesi

    DOÇ. DR. HALİ ÖZCAN GÜLÇÜR

  3. Localisation in 3-dimensional music production: Pannerbank application as a solution for positioning of multiple sources and extended panning aesthetics

    3 boyutlu müzik prodüksiyonunda lokalizasyon: Çoklu kaynakların pozisyonlanması ve ileri panlama estetiği için çözüm olarak Pannerbank uygulaması

    OĞUZ ÖZ

    Doktora

    İngilizce

    İngilizce

    2024

    Müzikİstanbul Teknik Üniversitesi

    Müzik Ana Bilim Dalı

    PROF. DR. CAN KARADOĞAN

  4. Ego noise estimation for robot audition

    Başlık çevirisi yok

    GÖKHAN İNCE

    Doktora

    İngilizce

    İngilizce

    2011

    Makine MühendisliğiTokyo Institute of Technology

    PROF. JUNİCHİ IMURA

  5. Time difference of arrival based passive sensing and positioning system integrated into moving platforms

    Geliş zamanı farkı yaklaşımlı hareketli platformlara entegre pasif yayın algılama ve konumlandırma sistemi

    BURAK AHMET ÇELEBİ

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    DOÇ. DR. MEHMET NURİ AKINCI