Speaker verification for microphone suitable data and audio diarization for Turkish broadcast news
Mikrofon verisine uygun konuşmacı doğrulama ve Türkçe haber programları için işitsel bölütleme
- Tez No: 297818
- Danışmanlar: DOÇ. DR. MURAT SARAÇLAR
- Tez Türü: Yüksek Lisans
- Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2011
- Dil: İngilizce
- Üniversite: Boğaziçi Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 119
Özet
Bu tezde konuşmacı doğrulama ve işitsel bölütleme üzerine çalışıldı. Konuşmacı doğrulamada amaç verilen iki söyleyişin aynı konuşmacı tarafından söylenip söylenmediğinin belirlenmesidir. Bu problem için bir çok yöntem önerilmiştir. Bu sistemlerin performasını inceleyebilmek ve son teknoloji yöntemlerini belirleyebilmek amacıyla bir çok araştırma grubundan araştırmacılar, Ulusal Standartlar ve Teknoloji Enstitüsü (NIST) tarafından düzenlenen her yılki Konuşmacı Tanıma Değerlendirmelerine (SRE) katılmaktadır. Türkiye'den 2010 yılında, Boğaziçi üniversitesi ile birlikte toplam üç grup bu değerlendirmeye katılmıştır. Değerlendirmeye katılmak için iki referans sistemi geliştirilmiş ve ilk katılım için kabul edilebilir sistem sonuçları elde edilmiştir. 2010 yılı değerlendirmelerindeki bir problem mikrofon verisi için geliştirme verisinin kısıtlı olmasıdır. 2010 değerlendirmesinde mikrofon test durumlarındaki sistem performasını artırılması amacıyla yeterli miktarda telefon verisi ile birlikte kısıtlı mikrofon verisinin kullanımı üzerine çalışıldı. Çalışmanın ikinci aşamasında işitsel bölütleme üzerine çalışıldı. Bölütleme verilen bir ses katarındaki bütün kaynakların açıklanmasıdır. Grubumuzca derlenen Türkçe Haber Programları verileri bu amaç için kullanıldı. Bir referans sistemi ile son teknoloji faktör analizi temelli bir işitsel bölütleyici geliştirildi ve bu iki sistemin karşılaştırmalı analizi raporlandı. Konuşmacı verisinin otomatik işitsel bölütleyiciyle elde edildiği konuşmacı uyarlamasının, konuşma işleme sistemi performansının iyileştirdiği bilinmektedir. Benzer bir çalışma Türkçe Haber Bültenleri kullanılarak uygulandı. Son olarak, çakışan konuşmaların bölütlenmesi üzerinde çalışıldı. Bu amaç için yeni bir algoritma önerildi. Önerilen yakalaşımın, sistem performasını iyileştirdiği deneylerde bir miktar çakışan konuşma içeren veriler kullanılarak gösterildi.
Özet (Çeviri)
In this thesis, speaker verification and audio diarization tasks are studied. The aim of speaker verification is to determine whether two utterances are spoken by same speaker. Investigators from many research group participate in the annual Speaker Recognition Evaluations (SRE) which is organized by the National Institute of Standards and Technology (NIST) in order to analyze the performance of various methods. In 2010, three groups from Turkey including Bo\u gazi\c ci University participated in the evaluation. Two baseline systems were developed for this evaluation and acceptable system performance was obtained for the first time submission. A problem with SRE 2010 is that development data for microphone case is sparse. Use of sufficient amount of telephone data in conjunction with limited microphone data is investigated to improve system performance of microphone conditions. The diarization is task of explanation of all sources in an audio. Turkish Broadcast News data is utilized in this task. Baseline and factor analysis based systems are developed and a comparative study between these two systems is reported. It has been shown that performance of speech recognition systems can be improved by adaptation of speakers whose data can be obtained via automated audio diarization. A similar study is performed using Turkish Broadcast News data. Lastly, a novel algorithm is proposed for segmentation of simultaneous speech segments. It is shown in the experiments that the proposed approach improved the overall system performance.
Benzer Tezler
- İnsan sesinin ayırt edici kapasitesinin irdelenmesi
Examination of distinctive capacity of human voice
SİNAN ERKAM TANDOĞAN
Yüksek Lisans
Türkçe
2018
Elektrik ve Elektronik MühendisliğiTOBB Ekonomi ve Teknoloji ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
PROF. DR. BÜLENT TAVLI
DOÇ. DR. HÜSREV TAHA SENCAR
- Yapay sinir ağları ile konuşmacı doğrulama sistemleri için saldırı tespiti
Using artificial neural network on anti-spoofing for speaker verification
BEKİR BAKAR
Yüksek Lisans
Türkçe
2018
Elektrik ve Elektronik MühendisliğiBursa Teknik ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
DOÇ. DR. CEMAL HANİLÇİ
- Destek vektör makineleri ile ses tanıma uygulaması
Speech recognition application with support vector machines
OSMAN ERAY
Yüksek Lisans
Türkçe
2008
Elektrik ve Elektronik MühendisliğiPamukkale ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
DOÇ. DR. SERDAR İPLİKÇİ
- Self score normalization and frame pruning techniques for speaker verification systems
Konuşmacı onaylama sistemleri için öz-skor düzgelemesi ve çerçeve budama yöntemleri
SUPHİ UMUT NACİ
Yüksek Lisans
İngilizce
2003
Elektrik ve Elektronik MühendisliğiBoğaziçi ÜniversitesiElektrik ve Elektronik Mühendisliği Ana Bilim Dalı
DOÇ. DR. LEVENT ARSLAN
- Bilgisayar yardımı ile seslerin analizi
Computer aided voices analysis
A.TARIK ERKAN
Doktora
Türkçe
1995
Fizik ve Fizik Mühendisliğiİstanbul ÜniversitesiFizik Ana Bilim Dalı
PROF. DR. TANER BULAT