Tek mikrofon ile ses kaynağı uzaklığı tahmini
Audio source distance estimation via single microphone
- Tez No: 518135
- Danışmanlar: PROF. DR. HAKKI GÖKHAN İLK
- Tez Türü: Yüksek Lisans
- Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2018
- Dil: Türkçe
- Üniversite: Ankara Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 47
Özet
Bu tez çalışmasında, geleneksel yöntemler (öznitelik çıkarımı ve sınıflandırma) ve derin ağlar ile öğrenme olmak üzere iki ayrı yöntem, tek mikrofon ile ses kaynağı mesafesi tahmini problemine çözüm olarak sunulmuştur. Veri seti olarak kullanılmak üzere öncelikle 1 metre, 2 metre, 3 metre ve 4 metrelik uzaklıklardan ses kayıtları toplanmıştır. Problem ilk olarak geleneksel yöntemler ile üç adımda çözülmüştür. İlk adımda ses aktivatörü kullanılarak sadece konuşma içeren ses sinyali alınmıştır ve Hanning pencereleme uygulanmıştır. İkinci adımda ise bu sinyalden öznitelikler çıkartılmıştır. Son adımda ise çıkartılan bu öznitelikler k-nn (k-nearest neighbour, k-en yakın komşuluk) sınıflandırıcı ile sınıflandırılıp mesafeye karar verilmiştir. İkinci yöntem olarak ise derin sinir ağları kullanılarak mesafeye karar verilmiştir. Derin sinir ağ yapısı, 1 giriş, 7 konvolüsyönel katman ve 1 çıkış katmanından oluşturulmuştur. Geleneksel yönteme göre derin sinir ağları ile elde edilen başarımda % 14'lük bir artış gözlenmiştir.
Özet (Çeviri)
In this thesis, traditional methods (feature extraction and classification) and deep neural networks, are presented as a solution to the sound source distance estimation problem via single microphone. As dataset, 1 meter, 2 meter, 3 meter and 4 meter recordings were used. The problem is solved in three steps by conventional methods. In the first step, a VAD (voice activity detector) and Hanning windowing are applied to speech signal. In the second step, features are extracted from this signal. In the last step, these extracted features are classified with k-nn (k-nearest neighborhood) classifier. As a second method, it has been decided to use deep neural networks. The deep network structure is composed of 1 input, 7 convolutional layers and 1 output layer. Compared with the conventional method, deep networks increased the performance of the overall system by 14 %.
Benzer Tezler
- Yeni Cami'nin akustik açıdan performans değerlendirmesi
Evaluation of the acoustical performance of the New Mosque
EVREN YILDIRIM
Yüksek Lisans
Türkçe
2003
Mimarlıkİstanbul Teknik ÜniversitesiMimarlık Ana Bilim Dalı
PROF. DR. SEVTAP YILMAZ DEMİRKALE
- Mikrofon dizilerinde ses kaynağının yerinin zaman farkı gecikmeleri kullanılarak bulunması
Sound source localization using microphone arrays by tdoa method
BİLGE MİNİSKER
Yüksek Lisans
Türkçe
2018
Mühendislik Bilimleriİstanbul Teknik ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
DOÇ. MÜRVET KIRCI
- Localization of multiple sound sources in three dimensional environments
Üç boyutlu ortamlarda bulunan çok sayıdaki ses kaynağının yerlerinin tespiti
MURAT ENGİN ÜNAL
Yüksek Lisans
İngilizce
2006
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi ÜniversitesiSistem ve Kontrol Mühendisliği Ana Bilim Dalı
PROF. DR. FİKRET GÜRGEN
- Tepe noktaları yakalama algoritması ile aktif gürültü kontrolü
Active noise control by peak picking algorithm
SÜLEYMAN GÖKOĞLU
- The investigation of the assignment of a primary path on the implementation of a feedforward active noise control system
İleri beslemeli bir aktif gürültü kontrolü sisteminin uygulanabilirliğinde birincil patika tayininin incelenmesi
KADİR KAAN AYTUĞ
Yüksek Lisans
İngilizce
2016
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiMakine Mühendisliği Ana Bilim Dalı
DOÇ. DR. İLKER MURAT KOÇ