Domain-specific keyword spotting
Alana özel anahtar kelime yakalama
- Tez No: 200279
- Danışmanlar: PROF.DR. LEVENT ARSLAN
- Tez Türü: Yüksek Lisans
- Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2007
- Dil: İngilizce
- Üniversite: Boğaziçi Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Belirtilmemiş.
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 111
Özet
Genis dağarcıklı sürekli konusma tanıma bazlı anahtar kelime yakalama sistemlerinde kullanılan dil model, performansa büyük ölçüde etki etmektedir. Bu çalısmada, anahtar kelimelere uyarlı bir dil modeli önerilmis ve Türkçe bir anahtar kelime yakalama sistemi olusturulmustur. Önerilen model iki farklı dil modeliyle karsılastırılmıstır. Bunlar tekli ve ikili dil modelleridir. Üçüncü ve bizim önerdiğimiz sistem ise, genis bir Türkçe veritabanından, içinde anahtar kelimelerin geçtiği cümlelerin çekilip, bu cümlelerde en çok geçen kelimelerle olusturulan dil modelini kullanan, yine SMM bazlı sistemdir. Deneyler sonucunda önerdiğimiz anahtar kelimeye uyarlı dil modeli, diğer modellere göre yakalama oranı ve yakalama süresinde daha iyi performans vermistir. Ulasılan en yüksek yakalama oranı yüzde 86'dır. Önerdiğimiz sistem yakalama oranında, ikili dil modeline göre yaklasık yüzde 4, tekli dil modeline göre de yaklasık yüzde 13 daha fazla mutlak basarı göstermistir. Kesinlik kriterinde ise önerilen model diğer iki modelin gerisinde kalmıstır. Kesinliği arttırmak için iki yöntem denenmistir. Bunlardan ilki dil modeli aradeğerlemesidir. Bu yöntem kesinliği arttırsa da, yakalama oranını düsürmüstür. ?kinci yöntem ise kelime ekleme cezasının ayarlanmasıdır. Anahtar kelimelerin uzunluğuna göre ayarlanan kelime ekleme cezasının sistem performansını arttırdığı gözlemlenmistir.
Özet (Çeviri)
In large vocabulary continuous speech recognition based keyword spotting applications, language modeling directly affects the system performance. In this study, a keyword adapted language model is proposed and a Turkish keyword spotting system is implemented. The proposed language model is compared with two other language models: null-grammar language model as the base model, and a general bigram model. Experiments show that keyword adapted language model gives the best performance in both recall and spotting time. Highest recall rate is 86 per cent. The model that we propose has absolutely increased the recall performance by 4 per cent from the general bigram language model, and by 13 per cent from the null-grammar language model. However, it gives lower precision results than the other systems. Two different methods are used in order to increase the precision of the system. The first method is language model interpolation, which increases the precision, but also decreases the recall. The second method is word insertion penalty adjustment. It is shown that length-adapted adjustment of the word insertion penalty can increase the overall system performance. Finally, a GUIbased computer program that uses the proposed language model is designed and implemented.
Benzer Tezler
- Yabancı dil olarak Türkçe öğretiminde sağlık bilimleri kapsamında derlem tabanlı söz varlığı çalışması
Corpus-based study of vocabulary in health sciences for teaching Turkish as a foreign language
TUNAHAN DEMİRBAŞ
Yüksek Lisans
Türkçe
2023
Eğitim ve ÖğretimHacettepe ÜniversitesiTürkiyat Araştırmaları Ana Bilim Dalı
PROF. DR. AYTEN GENÇ
- Lexical verbs in academic writings of Turkish learners of English as a second language: A corpus based study
Yabancı dil olarak İngilizce öğrenen Türk öğrencilerin akademik yazılarında sözcüksel eylemler: Bir derlem tabanlı çalışma
FATİH ÜNAL BOZDAĞ
Yüksek Lisans
İngilizce
2014
DilbilimÇukurova Üniversitesiİngiliz Dili Eğitimi Ana Bilim Dalı
PROF. DR. HATİCE SOFU
- An ontology-based retrieval system using semantic indexing
Anlamsal indeksleme kullanarak ontoloji-tabanlı sorgulama sistemi
SONER KARA
Yüksek Lisans
İngilizce
2010
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik ÜniversitesiBilgisayar Mühendisliği Bölümü
DOÇ. DR. NİHAN K. ÇİÇEKLİ
- Ontology learning and question answering (QA) systems
Ontoloji öğrenme ve soru cevaplama sistemleri
MELTEM BAŞKURT
Yüksek Lisans
İngilizce
2010
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik ÜniversitesiBilgisayar Mühendisliği Bölümü
DOÇ. DR. FERDA NUR ALPASLAN
- Exploring area-specific microblogger social networks
İlgi alanı bazlı mikroblog kullanıcıları sosyal ağlarının tespiti
ECE AKSU DEĞİRMENCİOĞLU
Yüksek Lisans
İngilizce
2010
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi ÜniversitesiBilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı
DR. SUZAN ÜSKÜDARLI