PC ortamında sesli komutları tanıma
Speech recognition of orders on PC
- Tez No: 84341
- Danışmanlar: YRD. DOÇ. DR. YILMAZ ÇAMURCU
- Tez Türü: Yüksek Lisans
- Konular: Elektrik ve Elektronik Mühendisliği, Eğitim ve Öğretim, Electrical and Electronics Engineering, Education and Training
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 1999
- Dil: Türkçe
- Üniversite: Marmara Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Elektronik Ana Bilim Dalı
- Bilim Dalı: Elektronik-Haberleşme Eğitimi Bilim Dalı
- Sayfa Sayısı: 215
Özet
ÖZET Bu çalışma da Windows 95/98 işletim sistemi kullanan kişisel bilgisayarlarda sesli komut yürüten yazılım geliştirilmiştir. Yazılım kişiye bağımlı olarak, kısıtlı sayıda kelimeyi tanımayı gerçekleştirmektedir. Yazılım, örüntü tanıma yöntemi kullanarak sesli komut tanımayı gerçekleştirmiştir. İlk bölümde, insanın duyma ve işitme fizyolojisi incelenmiş daha sonra sesli tanıma da karşılaşılan problemler ve problemleri aşmak için genel olarak kullanılan sistemler, yöntemler incelenmiştir. Ses tanıma yazılımı kelimenin bitiş ve başlangıcını tespiti için enerji yöntemi kullanılmaktadır. Başlangıç ve bitişi tespit edilerek yakalanan konuşma sinyaline yazılım pencereleme, filtreleme, FFT ve son aşamada özilişki fonksiyonu işlemlerini uygulamaktadır. Böylece referans olarak kabul edilecek ses sinyali elde edilir. Yakalanan ses program veya komutla ilişkilendirilmektedir. Kullanıcı aynı kelimeyi seslendirdiğinde program gelen sinyali referans sinyaliyle karşılaştırarak tanımayı gerçekleştirmektir. Yazılım uyguladığı pencereleme, filtreleme ve FFT yöntemlerinin kullandığı parametreleri menüler yardımıyla değiştirilmesine izin vermektedir. Yazılım da erkek ve kadın sesi kullanılarak testler yapılmıştır. Testler öğrenme sayısı artırılarak yapılmıştır. Öğrenme sayısı artıkça basan da artmıştır. Ses tanımanın başarılı olabilmesi için bazı kriterlere dikkat edilmesi gerekmektedir. En iyi tanıma oranı için tanımayı etkileyen tüm parametrelerin ince ayarlanması gerekir. Ayrıca mikrofona uzaklık, ortamın gürültüsü de ses tanıma da etkili olmaktadır. Seslerin söyleniş tarzları arasında da uyum olmalıdır. Bu yüzden veri tabanının oluşturulması aşamasında aynı sesin örnek sayısının artırılması tanınma başarısını artıracaktır. Örnekleme sayısı arttıkça ses tanımanın arttığı yapılan testlerde görülmektedir. Seslendirilen kelimelerin birbirine çok yakın olması tanımayı güçleştirmektedir. Bir önemli noktada söylenen kelimelerin ses tonundaki değişimdir. Değişimin fazla olması tanımayı başarısızlığa uğratır.
Özet (Çeviri)
SUMMARY The purpose of this study is to develop a software which runs speech command at a personal computer. It runs person dependent, also runs a small set of vocabulary. Software uses pattern recognition to recognize speech command. First part, hearing and hearing physiology is explained, then problems of speech recognition and common systems to overcome this problems is examined. Software uses energy method to find start and end of the speech. After identifiying start and end of speech is windowed, applied filters, applied FFT and last applied autocorrelation by software. So reference signal is obtained. Captured speech is correlated to a program or a command. When user speaks same word, software compare it to reference to recognize. Software is enable to change parameters of windowing, filter and FFT by menua. Results and suggestion is the last part. Test of software is done by using male and female speech. At tests training number is increased. Increasing of training number increased the success. To achieve success some criters must be cared. To increase success rate, parameters which effect the speech recognition performance should be fine tuned. Also distance from microphone, noise of space effects the performance of speech recognition. Repeating of speech should be similar, so increasing number of training of same word would increase speech recognition performance. Performance of speech recognition is increased at tests by increasing training number. Words is too close decreases speech recognition performance. Volume of speech is another important parameter of recognition. More different tones makes recognition is diffucult. Ill
Benzer Tezler
- Gömülü sistemlerde sesli komut tanıma
Voice command recognation in embedded systems
CAN ÇETİN
Yüksek Lisans
Türkçe
2020
Mekatronik Mühendisliğiİstanbul Teknik ÜniversitesiMekatronik Mühendisliği Ana Bilim Dalı
PROF. DR. MUSTAFA DOĞAN
- Modeling the solvent effect, kinetics,morphology and catalysis in polymerization reactions
Polimerizasyon tepkimelerinde çözücü etkisi, kinetik, morfoloji ve katalizin modellenmesi
TUĞBA ÖZALTIN
- Fluorescence technique for studying polymeric gels
Polimerik jellerin floresans tekniği ile incelenmesi
YAŞAR YILMAZ
- A Hardware and software implementation of a distributed network of fire and security control systems
Bir dağıtılmış yaygın ve güvenlik kontrol birimi şebekesinin donanım ve yazılımının gerçekleştirilmesi
HAYDAR BİLHAN
Yüksek Lisans
İngilizce
1993
Elektrik ve Elektronik MühendisliğiOrta Doğu Teknik ÜniversitesiElektrik Mühendisliği Ana Bilim Dalı
PROF. DR. KEMAL İNAN