Geri Dön

Speaker segmentation and diarization

Başlık çevirisi mevcut değil.

  1. Tez No: 402516
  2. Yazar: OYTUN GÜNEŞ
  3. Danışmanlar: DR. PATRICK NAYLOR
  4. Tez Türü: Yüksek Lisans
  5. Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2015
  8. Dil: İngilizce
  9. Üniversite: Imperial College London
  10. Enstitü: Yurtdışı Enstitü
  11. Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 70

Özet

Özet yok.

Özet (Çeviri)

Speaker Diarization has been developed as an emerging and one of the most important topics in speech processing. Having obtained a speech recording which contains different speakers, noise, and other audio signals, the task of diarization system is to label the speech segments with different speakers from the noisy mixture of speech recording. This study, includes a comprehensive literature review and technical background for speaker diarization, speech activity detection, MFCC features, segmentation, room acoustics, and Gaussian Mixture Models. A meeting in a room with two people is experimented. First, simulation is done on a variety of conditions including; different SNR, room size, pause duration, order of the speakers, microphone distance and reflection coefficient. Second, a 10 minutes real data is considered. The effect of the length of the trained data is investigated. Minimum 6% DER scores are obtained from the simulated and an average of 14% DER is obtained from 10 minutes real data.

Benzer Tezler

  1. Hibrit konuşma aktivite tespiti kullanılarak D-vektör tabanlı bir konuşmacı diyarizasyon sisteminin tasarlanması

    Implementation of a D-vector based speaker diarization system using hybrid voice activity detection

    YUNUS KORKMAZ

    Doktora

    Türkçe

    Türkçe

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolFırat Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ AYTUĞ BOYACI

  2. Speaker verification for microphone suitable data and audio diarization for Turkish broadcast news

    Mikrofon verisine uygun konuşmacı doğrulama ve Türkçe haber programları için işitsel bölütleme

    OĞUZ YILMAZ

    Yüksek Lisans

    İngilizce

    İngilizce

    2011

    Elektrik ve Elektronik MühendisliğiBoğaziçi Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    DOÇ. DR. MURAT SARAÇLAR

  3. Design of speaker diarization with speaker embeddings

    Konuşmacı katıştırmaları ile konuşmacı günlükleme tasarımı

    MUHAMMET MESUT TORUK

    Yüksek Lisans

    İngilizce

    İngilizce

    2020

    Bilim ve TeknolojiYıldız Teknik Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    DOÇ. DR. AHMET SERBES

    DOÇ. DR. GÖKHAN BİLGİN

  4. Konuşmacı tanıma metinsel kayıt ve analiz sisteminin oluşturulması

    Creating a model for text-dependent speaker diarization

    AMMAR AHMED ABDO SAEED

    Yüksek Lisans

    Türkçe

    Türkçe

    2022

    Bilgi ve Belge YönetimiMuğla Sıtkı Koçman Üniversitesi

    Bilişim Sistemleri Mühendisliği Ana Bilim Dalı

    DOÇ. DR. HÜSEYİN GÜRÜLER

  5. Cross-lingual voice conversion

    Diller arasında konuşmacı dönüştürme

    OYTUN TÜRK

    Doktora

    İngilizce

    İngilizce

    2007

    Elektrik ve Elektronik MühendisliğiBoğaziçi Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    PROF.DR. LEVENT MUSTAFA ARSLAN