Geri Dön

Supervised, semi-supervised and unsupervised methods in discriminative language modeling for automatic speech recognition

Otomatik konuşma tanıma için ayırıcı dil modellemede gözetimli, yarı-gözetimli ve gözetimsiz yöntemler

  1. Tez No: 459443
  2. Yazar: ERİNÇ DİKİCİ
  3. Danışmanlar: DOÇ. DR. MURAT SARAÇLAR
  4. Tez Türü: Doktora
  5. Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2016
  8. Dil: İngilizce
  9. Üniversite: Boğaziçi Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 122

Özet

Ayırıcı dil modelleme bir otomatik konuşma tanıma (OKT) sisteminin çıktılarını yeniden değerlendirerek hata oranlarını azaltmayı amaçlar. Ayırıcı dil modeli (ADM) eğitimi geleneksel olarak akustik kayıtların elle yazılandırılmış referanslar ile birlikte eğitim verisi olarak kullanıldığı gözetimli yöntemle yapılır. Konuşma tanıma başarımı söz konusu eşlenik verinin miktarına bağlı olarak artırılabilir. Bu tezde ADM eğitimi için gerekli eşlenik verinin yetersiz olduğu ya da mevcut olmadığı durumlar incelenmiş ve farklı kaynaklardan gelen akustik ve metinsel veriler kullanılarak OKT doğruluğunun iyileştirilmesine yönelik yöntemler araştırılmıştır. Yarı-gözetimli eğitim için, gerçek OKT hipotezlerine ek olarak yapay hipotezler türetmeyi sağlayan ağırlıklı sonlu durum makinesi ve makine çevirisi tabanlı karışıklık modelleri kullanılmaktadır. Gözetimsiz eğitim için, olmayan referansın yerine geçebilecek üç farklı hedef çıktı seçim yöntemi tanıtılmaktadır. Ayırıcı dil modelleme işlemi hem yapısal kestirim hem de yeniden sıralama problemi olarak ele alınmakta ve eğitim için algılayıcı, MIRA ve destek vektör makinesi algoritmalarının her iki problem için uyarlanmış çeşitleri kullanılmaktadır. Algoritmaların işlemsel karmaşıklığını azaltmak ve türetilen yapay hipotezlerin çeşitli\-liğini artırmak amacıyla çeşitli hipotez örnekleme yöntemleri önerilmektedir. Yapılan deneyler sonucunda elle yazılandırılmış akustik konuşma verisinin bulunmadığı durumda dahi temel OKT başarımında istatistiksel olarak anlamlı iyileştirmeler elde edilmiştir.

Özet (Çeviri)

Discriminative language modeling aims to reduce the error rates by rescoring the output of an automatic speech recognition (ASR) system. Discriminative language model (DLM) training conventionally follows a supervised approach, using acoustic recordings together with their manual transcriptions (reference) as training examples, and the recognition performance is improved with increasing amount of such matched data. In this thesis we investigate the case where matched data for DLM training is limited or not available at all, and explore methods to improve ASR accuracy by incorporating unmatched acoustic and text data that come from separate sources. For semi-supervised training, we utilize weighted finite-state transducer and machine translation based confusion models to generate artificial hypotheses in addition to the real ASR hypotheses. For unsupervised training, we explore target output selection methods to replace the missing reference. We handle discriminative language modeling both as a structured prediction and a reranking problem and employ variants of the perceptron, MIRA and SVM algorithms adapted for both problems. We propose several hypothesis sampling approaches to decrease the complexity of algorithms and to increase the diversity of artificial hypotheses. We obtain significant improvements over baseline ASR accuracy even when there is no transcribed acoustic data available to train the DLM.

Benzer Tezler

  1. Yapay zekâ ve demokrasi

    Artificial intelligence and democracy

    AYŞE NUR YAZICILAR

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    HukukGalatasaray Üniversitesi

    Kamu Hukuku Ana Bilim Dalı

    PROF. DR. ŞULE ÖZSOY BOYUNSUZ

  2. Türkçe sözcük anlam belirsizliği giderme

    Word sense disambiguation for Turkish

    BAHAR İLGEN

    Doktora

    Türkçe

    Türkçe

    2015

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. EŞREF ADALI

    YRD. DOÇ. DR. AHMET CÜNEYD TANTUĞ

  3. Automated analysis approach for the detection of high survivable ransomwares

    Sinsi fidye yazılımlarının tespiti için otomatik analiz yaklaşımı

    YAHYE ABUKAR AHMED AHMED

    Doktora

    İngilizce

    İngilizce

    2020

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSelçuk Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. BARIŞ KOÇER

    DR. SHAMSUL HUDA

  4. Dönüştürücü dil modellerine etkili hassas ayar yapmak için veri mühendisliği yöntemleri

    Data engineering methods for effective fine tuning transformers language models

    MUHAMMED SAİD ZENGİN

    Yüksek Lisans

    Türkçe

    Türkçe

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolTOBB Ekonomi ve Teknoloji Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ MÜCAHİD KUTLU

  5. Yassı alüminyum üretiminde kalite sınıflarının makine öğrenmesi yöntemleri ile tahminlenmesi

    Prediction of quality classification in flat rolled aluminium production using machine learning methods

    ALPEREN AYTATLI

    Doktora

    Türkçe

    Türkçe

    2024

    Endüstri ve Endüstri MühendisliğiSakarya Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ALPER KİRAZ