Yapay sinir ağlarını kullanarak bir ses tanıma sistemi geliştirilmesi
Developing a speech recognition system using artificial neural networks
- Tez No: 168130
- Danışmanlar: Y.DOÇ.DR. YILMAZ KILIÇASLAN
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2005
- Dil: Türkçe
- Üniversite: Trakya Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 82
Özet
Yüksek Lisans Tezi Trakya Üniversitesi Fen Bilimleri Enstitüsü ÖZET Bu çalışmada amacımız bir ses girdi cihazı ile alman konuşmayı metine çevirmektir. Bu amaç doğrultusunda konuşmacının söylediği belirli Türkçe kelimeler analiz edilerek metne çevrilip; konuşmacı bağımlı, fonem-tabanlı, ayrışık bir ses tanıma sistemi geliştirilmek istenmiştir. Birinci bölümde tezin amacı ayrıntılı bir şekilde açıklanmıştır. İkinci bölümde sesin özelliklerinden bahsedildi. Üçüncü bölümde ses tanıma işlemi hakkında bilgi verildi. îşlem adımları olarak sesin alınması, sesin sayısal kodlanması, ses sinyalini işleme teknikleri (ses analizi) ve ses sinyalinin modellenmesi ayrıntılı olarak açıklandı. Ses tanıma kullanıcıları ve kullanım alanları ile ses tanıma avantajları ve smırlamalarmdan bahsedildi. Dördüncü bölümde ses sinyalinin modellenmesinde kullamlan Saklı Markov Modelleri (SMM)'nin teorisi ve ses tanımadaki uygulaması anlatılmıştır. Beşinci bölümünde yine ses sinyali modelleme telcniklerinden biri olan ve tezimizin uygulama aşamasında faydalandığımız Yapay Sinir Ağları (YSA), teorisi ve ses tanımadaki kullanımı ile açıklanmıştır. Altıncı bölümde ses tanıma sistemimizin genel yapısı hakkında bilgi verildi. Sistemimizi oluşturan modüllerin uygulamamızdaki görevleri açıklandı. Yedinci bölümde sistemimizin genel yapısı ve gerçekleştirimi hakkında bilgi verildi. Sekizinci bölümde elde ettiğimiz sonuçlar ve programın genel bir değerlendirmesi yapıldı. Anahtar Kelimeler : Ses Tanıma, Yapay Sinir Ağları, Hızlı Fourier Dönüşümü, Saklı Markov Modelleri, Konuşmacı Bağımlı Ses Tanıma, Fonem Tabanlı Ses Tanıma. Yıl: 2005 Sayfa : 82
Özet (Çeviri)
11 Master Thesis Trakya Univercity Graduate School of Natural and Applied Sciences Departman of Computer Engineering SUMMARY In this study, our aim is to transform a speech fragment received via a sound reception instrument to a text fragment. To this effect, a speaker-dependent, phoneme- based and discrete speech recognition system has been developed that is intended to decode certain Turkish words uttered by a certain speaker into a textual format. In Section 1, the aim of the thesis is explained in detail. In Section 2, the acoustic features of sound are presented. In Section 3, some background information is given about the process of speech recognition. The phases of this process, which are sound reception, digitalization of the sound, processing sound signals (sound analysis) and modelling the sound signal, are given a detailed explanation. Users and areas of use of speech recognition systems are briefly presented along with the advantages of and constraints on these systems. In Section 4, an explanation is offered for the theory of Hidden Markov Models (HMMs), which is used in modelling the sound signal, and its application in speech recognition. In Section 5, an explanation is offered for the theory of Neural Artificial Network (ANN) which is used in modelling the sound signal, and its application in speech recognition. In Section 6, some information is given about the top-level structure of our speech recognition system. The modules constituing our system is presented in terms of the tasks they perform. In Section 7, the general structure of our system and its implementation are described. In Section 8, an evaluation is given for the findings we have obtained and for the program we have realized. Keywords : Speech Recognition, Artificial Neural Networks, Fast Fourier Transform, Hidden Markov Models, Speaker Dependent Speech Recognition, Phoneme Based Speech Recognition. Year: 2005 Page : 82
Benzer Tezler
- Silah seslerinin konvolüsyonel yapay sinir ağları ile sınıflandırılması ve atıcı konum tespitinin yapılması
Classification of weapon sounds with convolutional neural networks and detection of shooter location
İLYAS ÖZER
Doktora
Türkçe
2018
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKarabük ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. OĞUZ FINDIK
- Short term electricity load forecasting with deep learning
Derin öğrenme ile kısa dönemli elektrik yük talep tahmini
İBRAHİM YAZICI
Doktora
İngilizce
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ÖMER FARUK BEYCA
- Presentation attack detection with shuffled patch-wise binary supervision
Karıştırılmış yama tabanlı ikili gözetim ile sunum saldırı tespiti
ALPEREN KANTARCI
Yüksek Lisans
İngilizce
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. HAZIM KEMAL EKENEL
- Head gesture recognition for a semi-autonomous powerchair
Yarı-otonom akülü sandalye için kafa hareketleri tanıma
UBEYDE MAVUŞ
Yüksek Lisans
İngilizce
2017
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiKontrol ve Otomasyon Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. VOLKAN SEZER
- Panoramik görüntüler üzerinden su altı hedef tespiti: DBSCAN ve derin öğrenme ağları ile bütünleşik bir yaklaşım
Underwater target detection via panoramic images: An integrated approach with DBSCAN and deep learning networks
FATMA KÜBRA AKIN KÜÇÜK
Yüksek Lisans
Türkçe
2024
Savunma ve Savunma Teknolojileriİstanbul Teknik ÜniversitesiSavunma Teknolojileri Ana Bilim Dalı
PROF. DR. İBRAHİM ÖZKOL