Geri Dön

Face and speech recognition on field programmable gate array

Sahada programlanabilir kapı dizilerinde yüz ve konuşma tanımlama

  1. Tez No: 283550
  2. Yazar: GÖKHAN ÇETİN
  3. Danışmanlar: YRD. DOÇ. DR. NALAN ERDAŞ ÖZKURT
  4. Tez Türü: Yüksek Lisans
  5. Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2010
  8. Dil: İngilizce
  9. Üniversite: Dokuz Eylül Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 153

Özet

Bu çalışmanın amacı, Sahada Programlanabilir Kapı Dizilerini kullanarak, yüz ve konuşma bilgilerine bağlı olarak insanları tanımlayan bir sistem geliştirmektir.Bu çalışmanın araştırma aşamasında, özellik çıkarma teknikleri ve pazardaki Sahada Programlanabilir Kapı Dizilerinin geliştirme stratejileri araştırılmıştır. Seçilen tanıma metotlarına bağlı olarak, biyometrik tanıma alanında Sahada Programlanabilir Kapı Dizilerinin avantajlarını içermeyi amaçlayan bir tanıma yazılımı geliştirilmiştir. Bu çalışmada, genel prosedür, eğitme aşaması ve tanıma aşamasına bölünebilir. Eğitme aşamasında, yüz resimleri ve ses kayıtları, özellik çıkarma teknikleri kullanılarak ayrı ayrı işlenmiştir. Temel Bileşen Analizi ve Fourier Dönüşüm Analizi, sırasıyla, yüz ve konuşma tanıma için, özellik çıkarma yöntemleri olarak kullanılmıştır. Veritabanındaki tüm yüz resimlerini ve konuşma kayıtlarını içeren matris, Sahada Programlanabilir Kapı Dizilerinde işlenmiştir. Böylece, bir özellik matrisi yaratılmış ve Sahada Programlanabilir Kapı Dizilerinin hafızasında saklanmıştır. Tanıma aşamasında, bir yüz resmi ve ses kaydı, anlamlı bir özellik vektörü yaratmak için Sahada Programlanabilir Kapı Dizilerinde işlenmiştir. Sonuç vektörü, gelen bilginin sahibini bulmak için, ilgili veritabanıyla kıyaslanmıştır. Bu tez ayrıca, temel olarak yüz ve konuşma tanıma sistemlerini birleştiren çoklu biyometrik tanıma sisteminin geliştirme basamaklarını içermektedir. Çoklu biyometrik tanıma sistemi, yüz ve konuşma tanıma sistemlerinin karar verme seviyelerinde birleştirme işlemi yapmaktadır.Bu tez, farklı durumlarda sistemlerin sonuçlarını sunmakta ve çoklu biyometrik tanıma sistemleri ile tekli biyometrik tanıma sistemlerini avantaj ve dezavantaj bakımından karşılaştırmaktadır.

Özet (Çeviri)

The aim of this study is to develop a system by using Field Programmable Gate Array (FPGA) to recognize the people based on face and speech data.In the research stage of the study, feature extraction techniques and development strategies of FPGAs in the market were searched. Based on the selected recognition methods, recognition software was developed which intends to include the advantages of FPGAs in the area of biometric recognition. In this study, general procedure can be divided into training phase and recognition phase. In the training phase, face images and speech recordings were processed separately by using feature extraction techniques. Principal Component Analysis and Fourier Transform Analysis are used as feature extraction methods for face and speech recognition, respectively. The matrix which included all face images and speech recordings in database was processed in FPGA. Hence, a feature matrix was created and stored in the memory of FPGA. In the recognition phase, a face image and a speech recording was processed in FPGA to create a significant feature vector. The resultant data was compared to the related database to find the owner of the incoming data. This thesis also includes the development steps of a multibiometric recognition system which basically combines the face and speech recognition systems. It makes a fusion process at the decision levels of face and speech recognition systems.This thesis presents the results of systems in many cases and provides the possible advantages and disadvantages of multimodal recognition systems against unimodal recognition system.

Benzer Tezler

  1. Face recognition using neural networks on field programmable gate array

    Sahada programlanabilen kapi dizilerinde yapay sinir ağlari ile yüz tanima

    RECEP DOĞAN

    Yüksek Lisans

    İngilizce

    İngilizce

    2011

    Elektrik ve Elektronik MühendisliğiDokuz Eylül Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. NALAN ERDAS ÖZKURT

  2. Diyalog bazlı yapay zekâ ve yabancı dil: Konuşma öğretimi sürecinde bir model

    Conversational artificial intelligence and foreign language: A model in the process of teaching speaking

    ÖZKAN YAVUZ

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Üniversitesi

    Dilbilim Ana Bilim Dalı

    DOÇ. DR. MEHMET GÜRLEK

  3. Twitter verisi üzerinde Covid-19'a karşı etkili olan ilaçların doğal dil işleme kullanılarak analizi

    Analysis of drugs effective against Covid-19 using natural language processing on Twitter data

    ORHAN TALHA KUM

    Yüksek Lisans

    Türkçe

    Türkçe

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Bilimleri Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ SEFER BADAY

  4. Görüntü işlemede derin öğrenme tabanlı süper çözünürlük uygulamaları

    Deep learning based super resolution applications in image processing

    AHENK VURAL

    Yüksek Lisans

    Türkçe

    Türkçe

    2021

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    PROF. DR. ENDER METE EKŞİOĞLU

  5. Seyreklik ve sözlük öğrenme yaklaşımlarının sınıflandırma ve yüz tanımaya uygulanması

    Classification and face recognition application of sparsity and dictionary learning based methods

    BERNA AZİZOĞLU

    Yüksek Lisans

    Türkçe

    Türkçe

    2017

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ENDER METE EKŞİOĞLU