Speaker verification for microphone suitable data and audio diarization for Turkish broadcast news

Mikrofon verisine uygun konuşmacı doğrulama ve Türkçe haber programları için işitsel bölütleme

PDF İndir

Tez No: 297818
Yazar: OĞUZ YILMAZ
Danışmanlar: DOÇ. DR. MURAT SARAÇLAR
Tez Türü: Yüksek Lisans
Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
Anahtar Kelimeler: Belirtilmemiş.
Yıl: 2011
Dil: İngilizce
Üniversite: Boğaziçi Üniversitesi
Enstitü: Fen Bilimleri Enstitüsü
Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
Bilim Dalı: Belirtilmemiş.
Sayfa Sayısı: 119

Özet

Bu tezde konuşmacı doğrulama ve işitsel bölütleme üzerine çalışıldı. Konuşmacı doğrulamada amaç verilen iki söyleyişin aynı konuşmacı tarafından söylenip söylenmediğinin belirlenmesidir. Bu problem için bir çok yöntem önerilmiştir. Bu sistemlerin performasını inceleyebilmek ve son teknoloji yöntemlerini belirleyebilmek amacıyla bir çok araştırma grubundan araştırmacılar, Ulusal Standartlar ve Teknoloji Enstitüsü (NIST) tarafından düzenlenen her yılki Konuşmacı Tanıma Değerlendirmelerine (SRE) katılmaktadır. Türkiye'den 2010 yılında, Boğaziçi üniversitesi ile birlikte toplam üç grup bu değerlendirmeye katılmıştır. Değerlendirmeye katılmak için iki referans sistemi geliştirilmiş ve ilk katılım için kabul edilebilir sistem sonuçları elde edilmiştir. 2010 yılı değerlendirmelerindeki bir problem mikrofon verisi için geliştirme verisinin kısıtlı olmasıdır. 2010 değerlendirmesinde mikrofon test durumlarındaki sistem performasını artırılması amacıyla yeterli miktarda telefon verisi ile birlikte kısıtlı mikrofon verisinin kullanımı üzerine çalışıldı. Çalışmanın ikinci aşamasında işitsel bölütleme üzerine çalışıldı. Bölütleme verilen bir ses katarındaki bütün kaynakların açıklanmasıdır. Grubumuzca derlenen Türkçe Haber Programları verileri bu amaç için kullanıldı. Bir referans sistemi ile son teknoloji faktör analizi temelli bir işitsel bölütleyici geliştirildi ve bu iki sistemin karşılaştırmalı analizi raporlandı. Konuşmacı verisinin otomatik işitsel bölütleyiciyle elde edildiği konuşmacı uyarlamasının, konuşma işleme sistemi performansının iyileştirdiği bilinmektedir. Benzer bir çalışma Türkçe Haber Bültenleri kullanılarak uygulandı. Son olarak, çakışan konuşmaların bölütlenmesi üzerinde çalışıldı. Bu amaç için yeni bir algoritma önerildi. Önerilen yakalaşımın, sistem performasını iyileştirdiği deneylerde bir miktar çakışan konuşma içeren veriler kullanılarak gösterildi.

Özet (Çeviri)

In this thesis, speaker verification and audio diarization tasks are studied. The aim of speaker verification is to determine whether two utterances are spoken by same speaker. Investigators from many research group participate in the annual Speaker Recognition Evaluations (SRE) which is organized by the National Institute of Standards and Technology (NIST) in order to analyze the performance of various methods. In 2010, three groups from Turkey including Bo\u gazi\c ci University participated in the evaluation. Two baseline systems were developed for this evaluation and acceptable system performance was obtained for the first time submission. A problem with SRE 2010 is that development data for microphone case is sparse. Use of sufficient amount of telephone data in conjunction with limited microphone data is investigated to improve system performance of microphone conditions. The diarization is task of explanation of all sources in an audio. Turkish Broadcast News data is utilized in this task. Baseline and factor analysis based systems are developed and a comparative study between these two systems is reported. It has been shown that performance of speech recognition systems can be improved by adaptation of speakers whose data can be obtained via automated audio diarization. A similar study is performed using Turkish Broadcast News data. Lastly, a novel algorithm is proposed for segmentation of simultaneous speech segments. It is shown in the experiments that the proposed approach improved the overall system performance.

Benzer Tezler

Tez No
520878
İnsan sesinin ayırt edici kapasitesinin irdelenmesi
Examination of distinctive capacity of human voice
SİNAN ERKAM TANDOĞAN
Yüksek Lisans
Türkçe
2018
Elektrik ve Elektronik Mühendisliği TOBB Ekonomi ve Teknoloji Üniversitesi
Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
PROF. DR. BÜLENT TAVLI
DOÇ. DR. HÜSREV TAHA SENCAR
Tez No
533806
Yapay sinir ağları ile konuşmacı doğrulama sistemleri için saldırı tespiti
Using artificial neural network on anti-spoofing for speaker verification
BEKİR BAKAR
Yüksek Lisans
Türkçe
2018
Elektrik ve Elektronik Mühendisliği Bursa Teknik Üniversitesi
Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
DOÇ. DR. CEMAL HANİLÇİ
Tez No
179478
Destek vektör makineleri ile ses tanıma uygulaması
Speech recognition application with support vector machines
OSMAN ERAY
Yüksek Lisans
Türkçe
2008
Elektrik ve Elektronik Mühendisliği Pamukkale Üniversitesi
Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
DOÇ. DR. SERDAR İPLİKÇİ
Tez No
139425
Self score normalization and frame pruning techniques for speaker verification systems
Konuşmacı onaylama sistemleri için öz-skor düzgelemesi ve çerçeve budama yöntemleri
SUPHİ UMUT NACİ
Yüksek Lisans
İngilizce
2003
Elektrik ve Elektronik Mühendisliği Boğaziçi Üniversitesi
Elektrik ve Elektronik Mühendisliği Ana Bilim Dalı
DOÇ. DR. LEVENT ARSLAN
Tez No
46687
Bilgisayar yardımı ile seslerin analizi
Computer aided voices analysis
A.TARIK ERKAN
Doktora
Türkçe
1995
Fizik ve Fizik Mühendisliği İstanbul Üniversitesi
Fizik Ana Bilim Dalı
PROF. DR. TANER BULAT

Geri Dön