Computer-aided transcription tool
Bilgisayar destekli çevriyazı aracı
- Tez No: 200215
- Danışmanlar: YRD. DOÇ. DR. MURAT SARAÇLAR
- Tez Türü: Yüksek Lisans
- Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2007
- Dil: İngilizce
- Üniversite: Boğaziçi Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Elektrik ve Elektronik Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 88
Özet
Konuşma tanıma ve dil işleme sistemlerinde yaygın olarak veriye dayalı yöntemler kullanılmaktadır. Bu yöntemler büyük boyutlu yazıya çevrilmiş konuşma ve işlenmiş metin derlemleri gerektirmektedirler. Bu dizgelerin başarılı olmaları büyük ölçüde eğitim verisinin miktarına bağlıdır. Yazıya çevrilmiş konuşma gereksinimi, çevriyazmayı istatistiksel yöntemler kullanan her dizgenin önemli bir bileşeni yapmaktadır. Elle çevriyazım pahalı ve yavaş bir işlemdir. Bilgisayarlar aynı görevi daha hızlı ama daha çok hata yaparak gerçekleştirebilirler. Bilgisayar Destekli çevriyazı bu iki yöntemin birleştirilmesidir. çevriyazılacak konuşmalarla ilgili hipotezleri içeren ve bir konuşma tanıma motorunun çıktısı olan örüler, harf tabanlı, gerekirci, ağırlık sonlu durum alıcılarına dönüştürülmüştür. Bu dönüştürülmüş örüler içerik bakımından konuşma verisiyle örtüşen bir metin derlemiyle eğitilmiş harf tabanlı istatistiksel bir dil mode-liyle birleştirilmiştir. Birleşik model Cambridge üniversitesi'nde geliştirilmekte olan açık kaynak kodlu bir metin girişi uygulaması olan Dasher'ın dil modeli olarak kullanılmıştır. Birleşik modelin başarımını artırmak için örü genişletme yöntemleri kullanılmıştır. Modelleri harf düzeyinde birleştirmenin, tek model olarak kullanılan harf tabanlı bir istatistiksel dil modelinden ve modellerin cümle düzeyinde birleştirilmesiyle oluşturulan modelden daha iyi sonuçlar verdiği gösterilmiştir.
Özet (Çeviri)
State-of-the-art speech recognition and language processing systems widely use data-driven methods. These methods require large transcribed speech and annotated text corpora. The success of these systems greatly depends on the amount of the training data. Need for transcribed speech makes transcription an important component of every system employing statistical methods. Manual transcription is an expensive and slow task. Computers may do the same task much faster but with more errors. Computer Aided Transcription is a combination between these two methods. The output lattices of an ASR engine, which contain hypotheses about the utterances to be transcribed, are transformed into letter-based, deterministic, weighted finite-state acceptors. These transformed lattices are combined with a letter-based N-gram language model trained on a text corpus similar in content to the speech data. The combined model is used as the language model of the open source graphical text entry application Dasher, developed at the University of Cambridge. Lattice expansion methods are used to increase the performance of the combined model. It is shown that combining the models at letter level performs better than a letter-based N-gram model used as the only language model and the model built by combining the transformed lattices and letter-based N-gram model at sentence level.
Benzer Tezler
- Structure and interaction in Cretan leaping dances: Connecting ethnography and computational analysis
Girit danslarının yapısı ve etkileşimi: Etnoğrafya ve bilişimsel analizin bağlantısı
ANDRE HOLZAPFEL
Doktora
İngilizce
2018
Müzikİstanbul Teknik ÜniversitesiMüzik Ana Bilim Dalı
DOÇ. DR. EMİNE ŞİRİN ÖZGÜN TANIR
- Sanal tarama ve çok boyutlu moleküler modelleme yöntemleri ile p53-MDM2 potansiyel inhibitörlerinin belirlenmesi
Identification of p53-MDM2 potential inhibitors with virtual screening and multidimensional molecular modeling methods
GÜLŞAH AYDIN
Doktora
Türkçe
2020
Kimyaİstanbul Teknik ÜniversitesiKimya Ana Bilim Dalı
PROF. DR. MİNE YURTSEVER
PROF. DR. SERDAR DURDAĞI
- Prokaryotlarda ubiquitin benzeri proteinlerin biyoinformatik yöntemlerle belirlenmesi.
Identification of prokaryotic ubiquitin-like proteins by bioinformatic techniques.
ENGİN ŞENOL
Yüksek Lisans
Türkçe
2015
BiyolojiDumlupınar ÜniversitesiBiyoloji Ana Bilim Dalı
DOÇ. DR. AZMİ YERLİKAYA
- Hitit çiviyazısı i̇şaretlerinin bilgisayar desteği i̇le okunması ve veri madenciliği uygulama örnekleri
Computerized hittite cuneiform sign recognition and data mining application examples
TUNÇ AŞUROĞLU
Yüksek Lisans
Türkçe
2015
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBaşkent ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. AHMET ZİYA AKTAŞ
- In silico screening of potent histon demethylase1 (lsd1) enzyme inhibitor
In silico taramayla güçlü potansiyel histone demethylase 1 (lsd1) inhibitörlerinin bulunması
MARYAM MUHSIN TAHER AL-RIKABI
Yüksek Lisans
İngilizce
2020
Bilim ve TeknolojiKadir Has ÜniversitesiBiyoinformatik ve Genetik Ana Bilim Dalı
PROF. DR. KEMAL YELEKÇİ