Garbage modeling techniques for a Turkish keyword spotting system
Türkçe anahtar sözcük yakalama sistemi için değişik çöplük modellerinin incelenmesi
- Tez No: 95423
- Danışmanlar: DOÇ. DR. LEVENT ARSLAN
- Tez Türü: Yüksek Lisans
- Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2000
- Dil: İngilizce
- Üniversite: Boğaziçi Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Elektrik Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 132
Özet
VI ÖZET TÜRKÇE ANAHTAR SÖZCÜK YAKALAMA SİSTEMİ İÇİN DEĞİŞİK ÇÖPLÜK MODELLERİNİN İNCELENMESİ Anahtar sözcük yakalama sistemleri genel olarak rastgele konuşulan konuşmalardan belirli bir anahtar sözcük setini yakalamaya çalışır. Bu tip sistemlerde mümkün olan en yüksek anahtar sözcük yakalama oram sağlanmaya çalışılırken, yanlış alarmların sayısının en aza indirilmesi hedeflenir. Bu durumda sadece anahtar sözcükleri modellemek yeterli değildir, anahtar sözcükler dışındaki sözcükler içinde modellerin oluşturulması gerekir. Bu modeller genellikle çöplük modelleri olarak adlandırılır. Kullanılan çöplük modellerinin tipi ve yapısı sistemin performansı üzerinde büyük bir etkiye sahiptir. Değişik çöplük modellerini kullanan anahtar sözcük yakalama sistemlerini oluşturmak ve bu sistemlerin performanslarını bir kaç performans ölçüsü kullanarak ölçmek bu tezin ana konusunu oluşturmaktadır. Bu denemeler sonucunda en iyi performansı veren çöplük modeli asıl sistemde kullanılmak üzere seçilmiştir. Bu çalışmanın hedefi telefon hatları üzerinde çalışan bir sistem oluşturmaktır, o nedenle telefon hatları üzerinden TURTEL adı verilen bir ses veritabanı toplanmıştır. Daha sonra bu veritabanı tanıma modellerinin (üçlüses HMMs) ve çöplük modellerinin oluşturulması için kullanılmıştır. Ayrıca anahtar sözcük yakalama denemeleri de aynı veritabanı üzerinde yapılmıştır. Ana olarak 4 tip çöplük modeli kullanan 4 adet sistem oluşturulmuştur. Bunlar sırasıyla, anahtar sözcük yakalama sistemi* olarak kullanılan yüksek sayıda kelime tanıma yeteneğine sahip konuşma tanıma sistemi, bir genel çöplük modeli kullanan anahtar sözcük yakalama sistemi, ses sınıflarını çöplük modeli olarak kullanan anahtar sözcük yakalama sistemi ve teklisesleri çöplük modeli olarak kullanan anahtar sözcük yakalama sistemidir. Yapılan deneyler sonucunda teklisesleri çöplük modeli olarak kullanan anahtar sözcük yakalama sisteminin en başarılı sonuçlan verdiği görülmüştür.
Özet (Çeviri)
ABSTRACT GARBAGE MODELING TECHNIQUES FOR A TURKISH KEYWORD SPOTTING SYSTEM A keyword spotting system aims to detect a small set of keywords from unconstrained speech. In such systems, achieving the highest possible keyword detection rate is desirable while minimizing the number of false insertions. In this case, it is not sufficient to model only keywords, models for out-of-vocabulary words are also required to separate keywords form non-keywords. Out-of-vocabulary modeling is done using garbage models. Moreover, the structure and type of garbage model have a great effect on the overall system performance. The subject of this thesis is to construct different garbage models and evaluate the performance of the models in terms of several performance measures. Then the model which produces the best results can be selected for use. Since the target application is over the telephone lines, a database (TURTEL) is collected for training of subword recognition units (triphone HMMs) and garbage models. All the spotting experiments are performed on this database. Four types of systems that use different garbage models are constructed. These are, Large Vocabulary Speech Recognizer (LVSR) as word spotter, spotter with one general garbage model, spotter with phone class garbage models and spotter with context independent garbage models. As the result of our experiments we found that the best results are obtained with context independent garbage models.
Benzer Tezler
- Türkiye genelinde Bahel modeli ve yapay sinir ağları ile güneş radyasyonu tahmini
Solar radiation estimation for Turkey using Bahel model and artificial neural networks
ELVAN BURCU KOŞMA
Yüksek Lisans
Türkçe
2018
Enerjiİstanbul Teknik ÜniversitesiEnerji Bilim ve Teknoloji Ana Bilim Dalı
DR. ÖĞR. ÜYESİ BURAK BARUTÇU
- İnşa edilmiş geminin yerli katkı oranının belirlenmesi ve milli ürün kavramı
Determination of domestic contribution rate in builded ship and national product concept
CENGİZ GÖRKEM AKIN
Yüksek Lisans
Türkçe
2019
Denizcilikİstanbul Teknik ÜniversitesiDeniz Ulaştırma Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ İSMAİL ÇİÇEK
- Hedonic analysis of housing prices in istanbul: The effect of distance to urban green areas
İstanbul'daki konut fiyatlarının hedonik analizi: Kentsel yeşil alanlara uzaklığın etkisi
HASAN YILDIRIM
Yüksek Lisans
İngilizce
2019
Şehircilik ve Bölge Planlamaİstanbul Teknik ÜniversitesiŞehir ve Bölge Planlama Ana Bilim Dalı
PROF. DR. HÜSEYİN MURAT ÇELİK
- Triphone based Turkish word spotting system
Üç-ses modelli Türkçe kelime yakalama sistemi
DİNÇ ACAR
Yüksek Lisans
İngilizce
2001
Elektrik ve Elektronik MühendisliğiOrta Doğu Teknik ÜniversitesiElektrik ve Elektronik Mühendisliği Ana Bilim Dalı
PROF. DR. MÜBECCEL DEMİREKLER
- Siber güvenlik önlemlerinin analizi ve modellenmesi
Analysis and modeling of cyber security precautions
ÖMER DURMUŞ
Yüksek Lisans
Türkçe
2021
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolFırat ÜniversitesiYazılım Mühendisliği Ana Bilim Dalı
PROF. DR. ASAF VAROL