Geri Dön

PC ortamında sesli komutları tanıma

Speech recognition of orders on PC

  1. Tez No: 84341
  2. Yazar: SERKAN DOĞAN
  3. Danışmanlar: YRD. DOÇ. DR. YILMAZ ÇAMURCU
  4. Tez Türü: Yüksek Lisans
  5. Konular: Elektrik ve Elektronik Mühendisliği, Eğitim ve Öğretim, Electrical and Electronics Engineering, Education and Training
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 1999
  8. Dil: Türkçe
  9. Üniversite: Marmara Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Elektronik Ana Bilim Dalı
  12. Bilim Dalı: Elektronik-Haberleşme Eğitimi Bilim Dalı
  13. Sayfa Sayısı: 215

Özet

ÖZET Bu çalışma da Windows 95/98 işletim sistemi kullanan kişisel bilgisayarlarda sesli komut yürüten yazılım geliştirilmiştir. Yazılım kişiye bağımlı olarak, kısıtlı sayıda kelimeyi tanımayı gerçekleştirmektedir. Yazılım, örüntü tanıma yöntemi kullanarak sesli komut tanımayı gerçekleştirmiştir. İlk bölümde, insanın duyma ve işitme fizyolojisi incelenmiş daha sonra sesli tanıma da karşılaşılan problemler ve problemleri aşmak için genel olarak kullanılan sistemler, yöntemler incelenmiştir. Ses tanıma yazılımı kelimenin bitiş ve başlangıcını tespiti için enerji yöntemi kullanılmaktadır. Başlangıç ve bitişi tespit edilerek yakalanan konuşma sinyaline yazılım pencereleme, filtreleme, FFT ve son aşamada özilişki fonksiyonu işlemlerini uygulamaktadır. Böylece referans olarak kabul edilecek ses sinyali elde edilir. Yakalanan ses program veya komutla ilişkilendirilmektedir. Kullanıcı aynı kelimeyi seslendirdiğinde program gelen sinyali referans sinyaliyle karşılaştırarak tanımayı gerçekleştirmektir. Yazılım uyguladığı pencereleme, filtreleme ve FFT yöntemlerinin kullandığı parametreleri menüler yardımıyla değiştirilmesine izin vermektedir. Yazılım da erkek ve kadın sesi kullanılarak testler yapılmıştır. Testler öğrenme sayısı artırılarak yapılmıştır. Öğrenme sayısı artıkça basan da artmıştır. Ses tanımanın başarılı olabilmesi için bazı kriterlere dikkat edilmesi gerekmektedir. En iyi tanıma oranı için tanımayı etkileyen tüm parametrelerin ince ayarlanması gerekir. Ayrıca mikrofona uzaklık, ortamın gürültüsü de ses tanıma da etkili olmaktadır. Seslerin söyleniş tarzları arasında da uyum olmalıdır. Bu yüzden veri tabanının oluşturulması aşamasında aynı sesin örnek sayısının artırılması tanınma başarısını artıracaktır. Örnekleme sayısı arttıkça ses tanımanın arttığı yapılan testlerde görülmektedir. Seslendirilen kelimelerin birbirine çok yakın olması tanımayı güçleştirmektedir. Bir önemli noktada söylenen kelimelerin ses tonundaki değişimdir. Değişimin fazla olması tanımayı başarısızlığa uğratır.

Özet (Çeviri)

SUMMARY The purpose of this study is to develop a software which runs speech command at a personal computer. It runs person dependent, also runs a small set of vocabulary. Software uses pattern recognition to recognize speech command. First part, hearing and hearing physiology is explained, then problems of speech recognition and common systems to overcome this problems is examined. Software uses energy method to find start and end of the speech. After identifiying start and end of speech is windowed, applied filters, applied FFT and last applied autocorrelation by software. So reference signal is obtained. Captured speech is correlated to a program or a command. When user speaks same word, software compare it to reference to recognize. Software is enable to change parameters of windowing, filter and FFT by menua. Results and suggestion is the last part. Test of software is done by using male and female speech. At tests training number is increased. Increasing of training number increased the success. To achieve success some criters must be cared. To increase success rate, parameters which effect the speech recognition performance should be fine tuned. Also distance from microphone, noise of space effects the performance of speech recognition. Repeating of speech should be similar, so increasing number of training of same word would increase speech recognition performance. Performance of speech recognition is increased at tests by increasing training number. Words is too close decreases speech recognition performance. Volume of speech is another important parameter of recognition. More different tones makes recognition is diffucult. Ill

Benzer Tezler

  1. Gömülü sistemlerde sesli komut tanıma

    Voice command recognation in embedded systems

    CAN ÇETİN

    Yüksek Lisans

    Türkçe

    Türkçe

    2020

    Mekatronik Mühendisliğiİstanbul Teknik Üniversitesi

    Mekatronik Mühendisliği Ana Bilim Dalı

    PROF. DR. MUSTAFA DOĞAN

  2. Modeling the solvent effect, kinetics,morphology and catalysis in polymerization reactions

    Polimerizasyon tepkimelerinde çözücü etkisi, kinetik, morfoloji ve katalizin modellenmesi

    TUĞBA ÖZALTIN

    Doktora

    İngilizce

    İngilizce

    2016

    KimyaBoğaziçi Üniversitesi

    Kimya Ana Bilim Dalı

    PROF. DR. VİKTORYA AVİYENTE

  3. Fluorescence technique for studying polymeric gels

    Polimerik jellerin floresans tekniği ile incelenmesi

    YAŞAR YILMAZ

    Doktora

    İngilizce

    İngilizce

    1999

    Fizik ve Fizik Mühendisliğiİstanbul Teknik Üniversitesi

    PROF.DR. ÖNDER PEKCAN

  4. Expert systems in welding

    Kaynak teknolojisi için uzman sistem uygulamaları

    ÖZGÜR POLAT

    Yüksek Lisans

    İngilizce

    İngilizce

    1992

    Makine Mühendisliğiİstanbul Teknik Üniversitesi

    PROF. DR. BARLAS ERYÜREK

  5. A Hardware and software implementation of a distributed network of fire and security control systems

    Bir dağıtılmış yaygın ve güvenlik kontrol birimi şebekesinin donanım ve yazılımının gerçekleştirilmesi

    HAYDAR BİLHAN

    Yüksek Lisans

    İngilizce

    İngilizce

    1993

    Elektrik ve Elektronik MühendisliğiOrta Doğu Teknik Üniversitesi

    Elektrik Mühendisliği Ana Bilim Dalı

    PROF. DR. KEMAL İNAN