Geri Dön

Investigation of automatically derived subword units for turkish LVCSR

Türkçe GDSKT için otomatik olarak elde edilmiş kelime altı modellerin incelenmesi

  1. Tez No: 232620
  2. Yazar: TUNCAY AKSUNGURLU
  3. Danışmanlar: YRD. DOÇ. MURAT SARAÇLAR
  4. Tez Türü: Yüksek Lisans
  5. Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2008
  8. Dil: İngilizce
  9. Üniversite: Boğaziçi Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Elektrik ve Elektronik Mühendisliği Bölümü
  12. Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
  13. Sayfa Sayısı: 58

Özet

Bu tezde, Türkçe için uygun ve başarılı bir dil modeli yaratma yaklaşımı gerçekleştirebilmek amacıyla, farklı tanıma birimleri temel alınarak oluşturulmuş dil modelleri kullanılarak geniş dağarcıklı sürekli konuşma tanıma (GDSKT) deneyleri gerçekleştirilmiştir. Türkçe çok eklemeli bir dil olduğundan dolayı, dil modelinin nasıl oluşturulduğu tanıma başarımını ciddi şekilde etkilemektedir. Geleneksel kelime tabanlı dil modelleri İngilizce için iyi sonuçlar verirken, Türkçe'de, Türkçe'nin eklemeli yapısından ötürü, iyi çalışmamaktadırlar. Bu problemle başa çıkabilmek için, genel olarak morfem ve kök-kök sonrası kelime altı birimlerine dayanan, farklı kelime modelleme stratejileri önerilmiştir. Bu çalışmada eğitmensiz şekilde elde edilmiş kelime altı birimler incelenmiştir. Farklı yaklaşımlarla elde edilen bölütlemeler konuşma tanıma aşamasındaki performansları dikkate alınarak karşılaştırılmıştır. En iyi kelime hata oranı 25.24 olarak elde edilmiştir. Aynı deneyde kelime tabanlı dil modelleri kullanıldığında ise kelime hata oranı 26.90 olarak elde edilmiştir.

Özet (Çeviri)

In this thesis, we performed large vocabulary continuous speech recognition (LVCSR) experiments using language models that are built upon different recognition units in order to create a suitable and successful language modeling scheme for Turkish. Since Turkish is an agglutinative language, how you build the language model drastically affects the recognition performance. Whereas traditional word based language models give satisfactory results for English; they do not work well for Turkish due to the inductive morphology. Different language modeling strategies, mainly based on sub-word units like morphemes and stem-endings, are proposed in order to overcome this problem. In this work, the sub-words that are derived in an unsupervised manner, are investigated. Segmentation obtained using different approaches are compared due to their performance in speech recognition. The best WER that has been obtained is 25.24 whereas it has been obtained as 26.90 using the word-based language models.

Benzer Tezler

  1. Elastik zemine oturan betonarme kirişlerin elasto-plastik davranışının incelenmesi yapı sistemlerinin hesap yöntemlerinin karşılaştırılması

    Investigation of elastic-plastic behaviour of concrete beams on elastic foundation-comparison of methods of structural analysis

    İBRAHİM BAKAN

    Yüksek Lisans

    Türkçe

    Türkçe

    1992

    İnşaat Mühendisliğiİstanbul Teknik Üniversitesi

    PROF. DR. ERKAN ÖZER

  2. Dikey bir porselen levhadan taşınımla eşzamanlı ısı ve kütle geçişi olaylarının teorik & ampirik bağıntılar ve dijital görüntü işleme kullanılarak incelenmesi

    Investigation of convective heat and mass transfer phenomena from a vertical plate by using empirical correlations and digital image processing

    AYKUT EFE

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    Makine Mühendisliğiİstanbul Teknik Üniversitesi

    Makine Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ MURAT ÇAKAN

  3. Computer aided investigation of non ideal situations of linear circuits containing periodically operated swiches; aplications to switched-capacitor networks

    Peryodik olarak çalışan anahtarlar içeren lineer devrelerin ideal olmayan durumlarının incelenmesi; anahtarlanmış kapasitör devrelerinde uygulamalar

    TALAT KILCI

    Doktora

    İngilizce

    İngilizce

    1993

    Elektrik ve Elektronik MühendisliğiOrta Doğu Teknik Üniversitesi

    Elektrik ve Elektronik Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. ARİF NACAROĞLU

  4. Kömürün kendi kendine ısınmasının ve tutuşmasının modellenmesi, simülasyonu ve deneysel incelenmesi

    Mathematical modelling, simulation and experimental investigation of self – heating and self – ignition of coal

    BURHAN YÖRÜK

    Doktora

    Türkçe

    Türkçe

    2021

    Makine Mühendisliğiİstanbul Teknik Üniversitesi

    Makine Mühendisliği Ana Bilim Dalı

    PROF. DR. AHMET ARISOY