Semi-blind estimation of direct-to-reverberant energy ratio and distance using residual energy test statistics
Doğrudan-çınlanım oranı ve ses kaynağı uzaklığının doğrudan yol ölçevlerinin istatistikleri kullanılarak yarı kör tahmini
- Tez No: 826645
- Danışmanlar: PROF. DR. HÜSEYİN HACIHABİBOĞLU
- Tez Türü: Yüksek Lisans
- Konular: Bilim ve Teknoloji, Mühendislik Bilimleri, Science and Technology, Engineering Sciences
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2023
- Dil: İngilizce
- Üniversite: Orta Doğu Teknik Üniversitesi
- Enstitü: Enformatik Enstitüsü
- Ana Bilim Dalı: Modelleme ve Simülasyon Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 73
Özet
Bir ses kaynağının mikrofona olan doğrudan-çınlanım oranı (DÇO) ve uzaklığı, sırasıyla, oda akustiğinin ve gerçekleşen ses kaydının birer özellikleridir. Bu farklı gözüken özellikler yakından birbirleriyle ilişkilidirler; daha uzaktaki bir ses kaynağı daha düşük bir DÇO yaratır, ve tersi geçerlidir. Ses kaynağının uzaklığının ve DÇO'sunun tahmini, nesne bazlı ses sistemlerinde, bir veya birden çok mikrofon dizilerinin kullanılmasıyla kaydedilen sahnelerin yeniden inşasına yardımcı olabilecek önemli problemlerdir. Bu tez, bir ses kaynağının uzaklığını ve DÇO'sunun tahmini için yeni ve yarı-kör bir yaklaşım önermektedir. Bu yaklaşım, doğrudan yol ölçevlerinin istatistikleri ile farklı ses kayıt senaryolarının arasında gözlemlenen bağlılaşımı temel alır. Bu farklı senaryolar farklı uzaklıklar, DÇO'lar, oda geometrileri, bileşik hacimler gibi bileşenler içerebilir. Tahmin için önerilen yaklaşımın kullanılabilmesi için bir doğrusal regresyon modelinin parametrelerinin ayarlanmasını sağlayan, kalibrasyona benzer bir sürece ihtiyaç vardır. Kaynak ve kayıt cihazlarının farklı konumlandırılmalarıyla oluşan farklı ses kayıtları, gerekli istatistiklerin çıkartılması ve doğru uzaklık ve DÇO değerleriyle ilişkilendirilmesinde kullanılır. Parametreler ayarlandıktan sonra bu yaklaşım uzaklık ve DÇO tahmini için kullanılabilir. Görece basit geometri ve hacme sahip odalarda ortalama mutlak hata değerleri DÇO için 0.5 dB olup uzaklık için 0.07 m'dir. İçerisinde farklı akustik özellikli malzemeler olan ve görece daha bileşik hacimlerden oluşan odalar için ise hata değerleri artan uzaklıkla büyüyebiliyor; ortalama mutlak hata değerleri ise DÇO için 2.4 dB olup uzaklık için 1.2 m'dir. Bu hata değerlerinin, farklı tip sesler söz konusu olduğunda da aynı kaldığı, kalibrasyon aşamasında ses çeşitliliğin artırıldığında ise iyileştiği gözlemlenmiştir.
Özet (Çeviri)
Direct-to-reverberant ratio (DRR) and the distance of a sound source are attributes of room acoustics and a sound scene recorded in that room, respectively. These different attributes are intricately related: a source at a larger distance is associated with a lower DRR and vice versa. The identification of the source distance and DRR are two problems with use cases in object-based audio systems to enable the reconstruction of scenes recorded by one or more microphone arrays. This thesis proposes a novel approach for a semi-blind estimation of the distance of a sound source and the corresponding direct-to-reverberant ratio in a reverberant room. The proposed method is based on the observations on the correlation between the statistical features of a technique named residual energy test (RENT), and various recording scenarios, i.e. various distances, direct-to-reverberant ratios, room geometries, coupled volumes and the presupposition that systematic changes in the RENT metric can be used to develop a simple approach to estimate DRR and source distance. This proposed approach requires a procedure resembling a calibration step to extract the parameters of a linear regression model. Several recordings from various source-microphone positions in a room are used to extract the statistics that connect the RENT values to distance and direct-to-reverberant ratio value estimates. Once the relation between the RENT statistics and the distance and DRR information is established, the model is then used for estimating the attributes in question. It was observed that for rooms with simpler geometry and volume, the proposed approach affords a mean absolute error (MAE) of 0.5 dB for DRR and 0.07 m for distance. For rooms featuring various materials and coupled volumes, errors can grow with increasing distance, with an MAE of 2.4 dB for DRR and 1.2 m for distance. The performance remains the same for any audio content and is also found to improve when a wider variety of sounds are used in the calibration step.
Benzer Tezler
- Blind and semi-bnlind channel order estimation in SIMO systems
SIMO sistemlerde gözü kapalı ve yarı kapalı kanal derecesi kestirimi
SERKAN KARAKÜTÜK
Doktora
İngilizce
2009
Elektrik ve Elektronik MühendisliğiOrta Doğu Teknik ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
PROF. DR. TEMEL ENGİN TUNCER
- Seyrek hiperspektral karışım giderimi için çizge düzenli bolluk tahmini ve sözlük budama yaklaşımı
Graph regularized based abundance estimation and dictionary pruning approach for sparse hyperspectral unmixing
SEFA KÜÇÜK
Doktora
Türkçe
2021
Elektrik ve Elektronik MühendisliğiHacettepe ÜniversitesiElektrik ve Elektronik Mühendisliği Ana Bilim Dalı
DOÇ. DR. SENİHA ESEN YÜKSEL ERDEM
- Çok girişli çok çıkışlı iletişim sistemlerinde kanal kestirim yöntemlerinin incelenemsi
Investigation of channel estimation techniques in multiple input multiple output communication systems
SEDA ÜSTÜN ERCAN
Doktora
Türkçe
2016
Elektrik ve Elektronik MühendisliğiOndokuz Mayıs ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
PROF. DR. GÜVEN ÖNBİLGİN
- Dikgen frekans bölmeli çoğullama sistemleri için kanal kestirim yöntemlerinin başarımının incelenmesi
Investigation of the performance of the channel estimation methods for orthogonal frequency-division multiplexing systems
FATİH AYVENLİ
Yüksek Lisans
Türkçe
2019
Elektrik ve Elektronik MühendisliğiOndokuz Mayıs ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
DOÇ. DR. ÇETİN KURNAZ
- Haberleşme sistemlerinde gözü kapalı turbo denkleştirme algoritmalarının geliştirilmesi
Development of blind turbo equalization algorithms in the communication systems
SERKAN YAKUT
Doktora
Türkçe
2011
Elektrik ve Elektronik MühendisliğiSakarya ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
PROF. DR. ABDULLAH FERİKOĞLU