Geri Dön

Computer-aided transcription tool

Bilgisayar destekli çevriyazı aracı

  1. Tez No: 200215
  2. Yazar: ÇAĞDAŞ KAYRA AKMAN
  3. Danışmanlar: YRD. DOÇ. DR. MURAT SARAÇLAR
  4. Tez Türü: Yüksek Lisans
  5. Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2007
  8. Dil: İngilizce
  9. Üniversite: Boğaziçi Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Elektrik ve Elektronik Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 88

Özet

Konuşma tanıma ve dil işleme sistemlerinde yaygın olarak veriye dayalı yöntemler kullanılmaktadır. Bu yöntemler büyük boyutlu yazıya çevrilmiş konuşma ve işlenmiş metin derlemleri gerektirmektedirler. Bu dizgelerin başarılı olmaları büyük ölçüde eğitim verisinin miktarına bağlıdır. Yazıya çevrilmiş konuşma gereksinimi, çevriyazmayı istatistiksel yöntemler kullanan her dizgenin önemli bir bileşeni yapmaktadır. Elle çevriyazım pahalı ve yavaş bir işlemdir. Bilgisayarlar aynı görevi daha hızlı ama daha çok hata yaparak gerçekleştirebilirler. Bilgisayar Destekli çevriyazı bu iki yöntemin birleştirilmesidir. çevriyazılacak konuşmalarla ilgili hipotezleri içeren ve bir konuşma tanıma motorunun çıktısı olan örüler, harf tabanlı, gerekirci, ağırlık sonlu durum alıcılarına dönüştürülmüştür. Bu dönüştürülmüş örüler içerik bakımından konuşma verisiyle örtüşen bir metin derlemiyle eğitilmiş harf tabanlı istatistiksel bir dil mode-liyle birleştirilmiştir. Birleşik model Cambridge üniversitesi'nde geliştirilmekte olan açık kaynak kodlu bir metin girişi uygulaması olan Dasher'ın dil modeli olarak kullanılmıştır. Birleşik modelin başarımını artırmak için örü genişletme yöntemleri kullanılmıştır. Modelleri harf düzeyinde birleştirmenin, tek model olarak kullanılan harf tabanlı bir istatistiksel dil modelinden ve modellerin cümle düzeyinde birleştirilmesiyle oluşturulan modelden daha iyi sonuçlar verdiği gösterilmiştir.

Özet (Çeviri)

State-of-the-art speech recognition and language processing systems widely use data-driven methods. These methods require large transcribed speech and annotated text corpora. The success of these systems greatly depends on the amount of the training data. Need for transcribed speech makes transcription an important component of every system employing statistical methods. Manual transcription is an expensive and slow task. Computers may do the same task much faster but with more errors. Computer Aided Transcription is a combination between these two methods. The output lattices of an ASR engine, which contain hypotheses about the utterances to be transcribed, are transformed into letter-based, deterministic, weighted finite-state acceptors. These transformed lattices are combined with a letter-based N-gram language model trained on a text corpus similar in content to the speech data. The combined model is used as the language model of the open source graphical text entry application Dasher, developed at the University of Cambridge. Lattice expansion methods are used to increase the performance of the combined model. It is shown that combining the models at letter level performs better than a letter-based N-gram model used as the only language model and the model built by combining the transformed lattices and letter-based N-gram model at sentence level.

Benzer Tezler

  1. Structure and interaction in Cretan leaping dances: Connecting ethnography and computational analysis

    Girit danslarının yapısı ve etkileşimi: Etnoğrafya ve bilişimsel analizin bağlantısı

    ANDRE HOLZAPFEL

    Doktora

    İngilizce

    İngilizce

    2018

    Müzikİstanbul Teknik Üniversitesi

    Müzik Ana Bilim Dalı

    DOÇ. DR. EMİNE ŞİRİN ÖZGÜN TANIR

  2. Sanal tarama ve çok boyutlu moleküler modelleme yöntemleri ile p53-MDM2 potansiyel inhibitörlerinin belirlenmesi

    Identification of p53-MDM2 potential inhibitors with virtual screening and multidimensional molecular modeling methods

    GÜLŞAH AYDIN

    Doktora

    Türkçe

    Türkçe

    2020

    Kimyaİstanbul Teknik Üniversitesi

    Kimya Ana Bilim Dalı

    PROF. DR. MİNE YURTSEVER

    PROF. DR. SERDAR DURDAĞI

  3. Prokaryotlarda ubiquitin benzeri proteinlerin biyoinformatik yöntemlerle belirlenmesi.

    Identification of prokaryotic ubiquitin-like proteins by bioinformatic techniques.

    ENGİN ŞENOL

    Yüksek Lisans

    Türkçe

    Türkçe

    2015

    BiyolojiDumlupınar Üniversitesi

    Biyoloji Ana Bilim Dalı

    DOÇ. DR. AZMİ YERLİKAYA

  4. Hitit çiviyazısı i̇şaretlerinin bilgisayar desteği i̇le okunması ve veri madenciliği uygulama örnekleri

    Computerized hittite cuneiform sign recognition and data mining application examples

    TUNÇ AŞUROĞLU

    Yüksek Lisans

    Türkçe

    Türkçe

    2015

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBaşkent Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. AHMET ZİYA AKTAŞ

  5. In silico screening of potent histon demethylase1 (lsd1) enzyme inhibitor

    In silico taramayla güçlü potansiyel histone demethylase 1 (lsd1) inhibitörlerinin bulunması

    MARYAM MUHSIN TAHER AL-RIKABI

    Yüksek Lisans

    İngilizce

    İngilizce

    2020

    Bilim ve TeknolojiKadir Has Üniversitesi

    Biyoinformatik ve Genetik Ana Bilim Dalı

    PROF. DR. KEMAL YELEKÇİ