Voice driven keyword spotter
Ses girişli anahtar kelime tarayıcı
- Tez No: 181260
- Danışmanlar: PROF. DR. LEVENT ARSLAN, YRD. DOÇ. DR. MURAT SARAÇLAR
- Tez Türü: Yüksek Lisans
- Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2006
- Dil: İngilizce
- Üniversite: Boğaziçi Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 95
Özet
Ses beslemeli bir anahtar kelime tarayıcısı tasarladık. Sistemin başarısını artırmak için,doğal ses girişlerine ek olarak sistem tarafından doğal seslerin başkalaştırılması yoluyla yapayolarak yaratılan ses girişlerini ve birebir karakter dizisi eşleştirmesi yerine benzer karakterdizisi eşleştirmesini kullandık.Geleneksel anahtar kelime tarayıcıları, daha çok karakter dizisi beslemelidirler. Oysabiz tarayıcıyı ses ile besledik. Farklı insanlar aynı kelimeyi farklı şekillerde söyleyebilirler.Söylemde cinsiyet, yaş, milliyet, vurgulama, aksan, duygusal durum, çevre, gürültü vb.etkenlerin önemli bir etkisi vardır. Hatta, aynı kelimenin aynı insandan farklı zamanlardaalınan örnekleri bile farklılık gösterebilir. O nedenle, anahtar kelime tarayıcıyı, karakter dizisiyerine sesle beslemek bize bir tür çeşitlilik kaynağı sağlar. Bu çeşitlilik anahtar kelimeyibulma olasılığımızı artırır.Geleneksel anahtar kelime tarayıcılar çoğunlukla dil bağımlıdırlar. Geliştirdiğimiztarayıcıda, farklı dillere ait bir çok ses birimi tanıyıcısı bir arada bütünleşik olarakçalışabilmektedir. Sistemimizin bu özelliğinin onu büyük olasılıkla dilden bağımsızyapacağını düşünmekteyiz. Bir tek dile ait ses birimi tanıyıcısı kullanılsa bile, ses birimitanıyıcısı hem girdi tarafında için hem de tarama yaptığımız tarafta benzer hataları yapacak veanahtar kelime tarayıcısı yine büyük ölçüde dilden bağımsız çalışabilme şansına sahipolacaktır.Girdiyi ses formatında aldığımız için, anahtar kelimenin birçok örneğini toplama ve buörneklerin uygun dönüşümlerini yaratma şansımız vardır. Bu özellik, sistemin konuşmacıyaolan bağımlılığını azaltır.
Özet (Çeviri)
We designed a voice driven keyword spotter. To improve the success of the system,we made use of synthetically generated voice inputs in addition to natural voice inputs andused approximate string matching instead of exact string matching.Classical keyword spotters are mostly text driven. However, we have taken the inputin the form of voice. Different people may pronounce the same keyword in different waysbecause effects such as gender, age, nationality, intonation, accent, emotional mood,environment, noise etc. play an important role on pronunciation. Even the samples of akeyword taken from the same person at different times may be different. Therefore, drivingthe keyword spotter with voice instead of text provides us with a source of variety. Thisvariety increases the probability of spotting the keyword.Classical keyword spotters are mostly language dependent. In our spotter, manyphoneme recognizers trained with different languages may be used in co-operation. Webelieve that, this ability of our spotter is highly likely to make it language independent. Evenif a phoneme recognizer of only one language is used, it will make similar errors for both theinput side and the search database side and the system may still have the chance of beinglanguage independent to some extent.As we take the input in voice format, we have the chance of collecting many samplesof the keyword and producing their appropriate transformations. This ability of our spotteralleviates speaker dependency.
Benzer Tezler
- Soyut sanat anlayışının güzel sanatlar fakülteleri resim anasanat dalları resim atölye derslerine yansımaları
The reflections of the abstract art consept to the painting courses of the fine arts faculties painting art majors
SÜMEYRA GÖKTEPELİ
Yüksek Lisans
Türkçe
2020
Güzel SanatlarSelçuk ÜniversitesiResim Ana Sanat Dalı
PROF. DR. AHMET DALKIRAN
- Quality of service in voip communication
Internet protokolü üzerinden ses iletişiminde servis kalitesi
UTKU ERGÜL
Yüksek Lisans
İngilizce
2004
Elektrik ve Elektronik MühendisliğiDokuz Eylül ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. ZAFER DİCLE
- Giyim mağazalarında moda kavramı ve kurum kimliğinin mekan tasarımına etkisi
Fashion concept in clothing stores and the influence of corporate identity on the design of places
ESRA TOPBAŞ ERMİŞ
Yüksek Lisans
Türkçe
2009
MimarlıkMimar Sinan Güzel Sanatlar Üniversitesiİç Mimarlık Ana Bilim Dalı
PROF. DR. ONUR ALTAN
- GPS ile araç takip ve yönlendirme sistemi
Vehicle tracking and guidance system using GPS
SONER ÇINAR
Yüksek Lisans
Türkçe
2005
Elektrik ve Elektronik MühendisliğiHacettepe ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
Y.DOÇ.DR. ALİ ZİYA ALKAR
- Home automation using wireless sensor networks and network topologies
Başlık çevirisi yok
REEM TALAL ABDULHAMEED
Yüksek Lisans
İngilizce
2020
Bilim ve TeknolojiAltınbaş ÜniversitesiElektrik ve Bilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ SEFER KURNAZ