Supervised, semi-supervised and unsupervised methods in discriminative language modeling for automatic speech recognition
Otomatik konuşma tanıma için ayırıcı dil modellemede gözetimli, yarı-gözetimli ve gözetimsiz yöntemler
- Tez No: 459443
- Danışmanlar: DOÇ. DR. MURAT SARAÇLAR
- Tez Türü: Doktora
- Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2016
- Dil: İngilizce
- Üniversite: Boğaziçi Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 122
Özet
Ayırıcı dil modelleme bir otomatik konuşma tanıma (OKT) sisteminin çıktılarını yeniden değerlendirerek hata oranlarını azaltmayı amaçlar. Ayırıcı dil modeli (ADM) eğitimi geleneksel olarak akustik kayıtların elle yazılandırılmış referanslar ile birlikte eğitim verisi olarak kullanıldığı gözetimli yöntemle yapılır. Konuşma tanıma başarımı söz konusu eşlenik verinin miktarına bağlı olarak artırılabilir. Bu tezde ADM eğitimi için gerekli eşlenik verinin yetersiz olduğu ya da mevcut olmadığı durumlar incelenmiş ve farklı kaynaklardan gelen akustik ve metinsel veriler kullanılarak OKT doğruluğunun iyileştirilmesine yönelik yöntemler araştırılmıştır. Yarı-gözetimli eğitim için, gerçek OKT hipotezlerine ek olarak yapay hipotezler türetmeyi sağlayan ağırlıklı sonlu durum makinesi ve makine çevirisi tabanlı karışıklık modelleri kullanılmaktadır. Gözetimsiz eğitim için, olmayan referansın yerine geçebilecek üç farklı hedef çıktı seçim yöntemi tanıtılmaktadır. Ayırıcı dil modelleme işlemi hem yapısal kestirim hem de yeniden sıralama problemi olarak ele alınmakta ve eğitim için algılayıcı, MIRA ve destek vektör makinesi algoritmalarının her iki problem için uyarlanmış çeşitleri kullanılmaktadır. Algoritmaların işlemsel karmaşıklığını azaltmak ve türetilen yapay hipotezlerin çeşitli\-liğini artırmak amacıyla çeşitli hipotez örnekleme yöntemleri önerilmektedir. Yapılan deneyler sonucunda elle yazılandırılmış akustik konuşma verisinin bulunmadığı durumda dahi temel OKT başarımında istatistiksel olarak anlamlı iyileştirmeler elde edilmiştir.
Özet (Çeviri)
Discriminative language modeling aims to reduce the error rates by rescoring the output of an automatic speech recognition (ASR) system. Discriminative language model (DLM) training conventionally follows a supervised approach, using acoustic recordings together with their manual transcriptions (reference) as training examples, and the recognition performance is improved with increasing amount of such matched data. In this thesis we investigate the case where matched data for DLM training is limited or not available at all, and explore methods to improve ASR accuracy by incorporating unmatched acoustic and text data that come from separate sources. For semi-supervised training, we utilize weighted finite-state transducer and machine translation based confusion models to generate artificial hypotheses in addition to the real ASR hypotheses. For unsupervised training, we explore target output selection methods to replace the missing reference. We handle discriminative language modeling both as a structured prediction and a reranking problem and employ variants of the perceptron, MIRA and SVM algorithms adapted for both problems. We propose several hypothesis sampling approaches to decrease the complexity of algorithms and to increase the diversity of artificial hypotheses. We obtain significant improvements over baseline ASR accuracy even when there is no transcribed acoustic data available to train the DLM.
Benzer Tezler
- Yapay zekâ ve demokrasi
Artificial intelligence and democracy
AYŞE NUR YAZICILAR
Yüksek Lisans
Türkçe
2023
HukukGalatasaray ÜniversitesiKamu Hukuku Ana Bilim Dalı
PROF. DR. ŞULE ÖZSOY BOYUNSUZ
- Türkçe sözcük anlam belirsizliği giderme
Word sense disambiguation for Turkish
BAHAR İLGEN
Doktora
Türkçe
2015
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. EŞREF ADALI
YRD. DOÇ. DR. AHMET CÜNEYD TANTUĞ
- Automated analysis approach for the detection of high survivable ransomwares
Sinsi fidye yazılımlarının tespiti için otomatik analiz yaklaşımı
YAHYE ABUKAR AHMED AHMED
Doktora
İngilizce
2020
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSelçuk ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. BARIŞ KOÇER
DR. SHAMSUL HUDA
- Dönüştürücü dil modellerine etkili hassas ayar yapmak için veri mühendisliği yöntemleri
Data engineering methods for effective fine tuning transformers language models
MUHAMMED SAİD ZENGİN
Yüksek Lisans
Türkçe
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolTOBB Ekonomi ve Teknoloji ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ MÜCAHİD KUTLU
- Yassı alüminyum üretiminde kalite sınıflarının makine öğrenmesi yöntemleri ile tahminlenmesi
Prediction of quality classification in flat rolled aluminium production using machine learning methods
ALPEREN AYTATLI
Doktora
Türkçe
2024
Endüstri ve Endüstri MühendisliğiSakarya ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
DOÇ. DR. ALPER KİRAZ