Speaker segmentation and diarization
Başlık çevirisi mevcut değil.
- Tez No: 402516
- Danışmanlar: DR. PATRICK NAYLOR
- Tez Türü: Yüksek Lisans
- Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2015
- Dil: İngilizce
- Üniversite: Imperial College London
- Enstitü: Yurtdışı Enstitü
- Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 70
Özet
Özet yok.
Özet (Çeviri)
Speaker Diarization has been developed as an emerging and one of the most important topics in speech processing. Having obtained a speech recording which contains different speakers, noise, and other audio signals, the task of diarization system is to label the speech segments with different speakers from the noisy mixture of speech recording. This study, includes a comprehensive literature review and technical background for speaker diarization, speech activity detection, MFCC features, segmentation, room acoustics, and Gaussian Mixture Models. A meeting in a room with two people is experimented. First, simulation is done on a variety of conditions including; different SNR, room size, pause duration, order of the speakers, microphone distance and reflection coefficient. Second, a 10 minutes real data is considered. The effect of the length of the trained data is investigated. Minimum 6% DER scores are obtained from the simulated and an average of 14% DER is obtained from 10 minutes real data.
Benzer Tezler
- Hibrit konuşma aktivite tespiti kullanılarak D-vektör tabanlı bir konuşmacı diyarizasyon sisteminin tasarlanması
Implementation of a D-vector based speaker diarization system using hybrid voice activity detection
YUNUS KORKMAZ
Doktora
Türkçe
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolFırat ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ AYTUĞ BOYACI
- Speaker verification for microphone suitable data and audio diarization for Turkish broadcast news
Mikrofon verisine uygun konuşmacı doğrulama ve Türkçe haber programları için işitsel bölütleme
OĞUZ YILMAZ
Yüksek Lisans
İngilizce
2011
Elektrik ve Elektronik MühendisliğiBoğaziçi ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
DOÇ. DR. MURAT SARAÇLAR
- Design of speaker diarization with speaker embeddings
Konuşmacı katıştırmaları ile konuşmacı günlükleme tasarımı
MUHAMMET MESUT TORUK
Yüksek Lisans
İngilizce
2020
Bilim ve TeknolojiYıldız Teknik ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
DOÇ. DR. AHMET SERBES
DOÇ. DR. GÖKHAN BİLGİN
- Konuşmacı tanıma metinsel kayıt ve analiz sisteminin oluşturulması
Creating a model for text-dependent speaker diarization
AMMAR AHMED ABDO SAEED
Yüksek Lisans
Türkçe
2022
Bilgi ve Belge YönetimiMuğla Sıtkı Koçman ÜniversitesiBilişim Sistemleri Mühendisliği Ana Bilim Dalı
DOÇ. DR. HÜSEYİN GÜRÜLER
- Cross-lingual voice conversion
Diller arasında konuşmacı dönüştürme
OYTUN TÜRK
Doktora
İngilizce
2007
Elektrik ve Elektronik MühendisliğiBoğaziçi ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
PROF.DR. LEVENT MUSTAFA ARSLAN