Geri Dön

Speaker verification for microphone suitable data and audio diarization for Turkish broadcast news

Mikrofon verisine uygun konuşmacı doğrulama ve Türkçe haber programları için işitsel bölütleme

  1. Tez No: 297818
  2. Yazar: OĞUZ YILMAZ
  3. Danışmanlar: DOÇ. DR. MURAT SARAÇLAR
  4. Tez Türü: Yüksek Lisans
  5. Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2011
  8. Dil: İngilizce
  9. Üniversite: Boğaziçi Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 119

Özet

Bu tezde konuşmacı doğrulama ve işitsel bölütleme üzerine çalışıldı. Konuşmacı doğrulamada amaç verilen iki söyleyişin aynı konuşmacı tarafından söylenip söylenmediğinin belirlenmesidir. Bu problem için bir çok yöntem önerilmiştir. Bu sistemlerin performasını inceleyebilmek ve son teknoloji yöntemlerini belirleyebilmek amacıyla bir çok araştırma grubundan araştırmacılar, Ulusal Standartlar ve Teknoloji Enstitüsü (NIST) tarafından düzenlenen her yılki Konuşmacı Tanıma Değerlendirmelerine (SRE) katılmaktadır. Türkiye'den 2010 yılında, Boğaziçi üniversitesi ile birlikte toplam üç grup bu değerlendirmeye katılmıştır. Değerlendirmeye katılmak için iki referans sistemi geliştirilmiş ve ilk katılım için kabul edilebilir sistem sonuçları elde edilmiştir. 2010 yılı değerlendirmelerindeki bir problem mikrofon verisi için geliştirme verisinin kısıtlı olmasıdır. 2010 değerlendirmesinde mikrofon test durumlarındaki sistem performasını artırılması amacıyla yeterli miktarda telefon verisi ile birlikte kısıtlı mikrofon verisinin kullanımı üzerine çalışıldı. Çalışmanın ikinci aşamasında işitsel bölütleme üzerine çalışıldı. Bölütleme verilen bir ses katarındaki bütün kaynakların açıklanmasıdır. Grubumuzca derlenen Türkçe Haber Programları verileri bu amaç için kullanıldı. Bir referans sistemi ile son teknoloji faktör analizi temelli bir işitsel bölütleyici geliştirildi ve bu iki sistemin karşılaştırmalı analizi raporlandı. Konuşmacı verisinin otomatik işitsel bölütleyiciyle elde edildiği konuşmacı uyarlamasının, konuşma işleme sistemi performansının iyileştirdiği bilinmektedir. Benzer bir çalışma Türkçe Haber Bültenleri kullanılarak uygulandı. Son olarak, çakışan konuşmaların bölütlenmesi üzerinde çalışıldı. Bu amaç için yeni bir algoritma önerildi. Önerilen yakalaşımın, sistem performasını iyileştirdiği deneylerde bir miktar çakışan konuşma içeren veriler kullanılarak gösterildi.

Özet (Çeviri)

In this thesis, speaker verification and audio diarization tasks are studied. The aim of speaker verification is to determine whether two utterances are spoken by same speaker. Investigators from many research group participate in the annual Speaker Recognition Evaluations (SRE) which is organized by the National Institute of Standards and Technology (NIST) in order to analyze the performance of various methods. In 2010, three groups from Turkey including Bo\u gazi\c ci University participated in the evaluation. Two baseline systems were developed for this evaluation and acceptable system performance was obtained for the first time submission. A problem with SRE 2010 is that development data for microphone case is sparse. Use of sufficient amount of telephone data in conjunction with limited microphone data is investigated to improve system performance of microphone conditions. The diarization is task of explanation of all sources in an audio. Turkish Broadcast News data is utilized in this task. Baseline and factor analysis based systems are developed and a comparative study between these two systems is reported. It has been shown that performance of speech recognition systems can be improved by adaptation of speakers whose data can be obtained via automated audio diarization. A similar study is performed using Turkish Broadcast News data. Lastly, a novel algorithm is proposed for segmentation of simultaneous speech segments. It is shown in the experiments that the proposed approach improved the overall system performance.

Benzer Tezler

  1. İnsan sesinin ayırt edici kapasitesinin irdelenmesi

    Examination of distinctive capacity of human voice

    SİNAN ERKAM TANDOĞAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2018

    Elektrik ve Elektronik MühendisliğiTOBB Ekonomi ve Teknoloji Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    PROF. DR. BÜLENT TAVLI

    DOÇ. DR. HÜSREV TAHA SENCAR

  2. Yapay sinir ağları ile konuşmacı doğrulama sistemleri için saldırı tespiti

    Using artificial neural network on anti-spoofing for speaker verification

    BEKİR BAKAR

    Yüksek Lisans

    Türkçe

    Türkçe

    2018

    Elektrik ve Elektronik MühendisliğiBursa Teknik Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    DOÇ. DR. CEMAL HANİLÇİ

  3. Destek vektör makineleri ile ses tanıma uygulaması

    Speech recognition application with support vector machines

    OSMAN ERAY

    Yüksek Lisans

    Türkçe

    Türkçe

    2008

    Elektrik ve Elektronik MühendisliğiPamukkale Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    DOÇ. DR. SERDAR İPLİKÇİ

  4. Self score normalization and frame pruning techniques for speaker verification systems

    Konuşmacı onaylama sistemleri için öz-skor düzgelemesi ve çerçeve budama yöntemleri

    SUPHİ UMUT NACİ

    Yüksek Lisans

    İngilizce

    İngilizce

    2003

    Elektrik ve Elektronik MühendisliğiBoğaziçi Üniversitesi

    Elektrik ve Elektronik Mühendisliği Ana Bilim Dalı

    DOÇ. DR. LEVENT ARSLAN

  5. Bilgisayar yardımı ile seslerin analizi

    Computer aided voices analysis

    A.TARIK ERKAN

    Doktora

    Türkçe

    Türkçe

    1995

    Fizik ve Fizik Mühendisliğiİstanbul Üniversitesi

    Fizik Ana Bilim Dalı

    PROF. DR. TANER BULAT