Geri Dön

Modelling human-robot audition for sound localization with deep neural network

Derin sinir ağı ile ses yerelleştirmesi için insan-robot seçmelerinin modellenmesi

  1. Tez No: 937327
  2. Yazar: MOHAMMAD IBRAHİM KHLİL AL KARAKI
  3. Danışmanlar: DR. IHAB ELAFF
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2024
  8. Dil: İngilizce
  9. Üniversite: Üsküdar Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 82

Özet

Hesaplamalı işitsel sistemler alanında bu araştırma, insan sesinin lokalizasyonunu modelleme gibi karmaşık bir görev için derin bir sinir ağından yararlanarak yeni bir yaklaşıma öncülük ediyor. Pratiklik ve verimliliği hedefleyen çalışma, bu hesaplamalı modeli kompakt ve çok yönlü Raspberry Pi platformuna benzersiz bir şekilde entegre ederek gerçek dünya uygulamaları için somut bir çözüm sunuyor. Geleneksel ses lokalizasyon yöntemlerinin doğasında var olan kısıtlamalardan yola çıkan bu araştırma, daha doğru ve uyarlanabilir bir işitsel sistem kurarak yeni bir çığır açmayı amaçlıyor.

Özet (Çeviri)

In the realm of computational auditory systems, this research pioneers a novel approach by leveraging a deep neural network for the intricate task of modeling human sound localization. Aiming for practicality and efficiency, the study uniquely integrates this computational model into the compact and versatile Raspberry Pi platform, presenting a tangible solution for real-world applications. Motivated by the inherent constraints of traditional sound localization methods, this research seeks to break new ground by establishing a more accurate and adaptive auditory system. Objectives and Methodology The primary objectives encompass the design and implementation of a customized deep neural network tailored explicitly for sound localization. This computational model is seamlessly integrated into the Raspberry Pi environment, harnessing its accessibility and cost-effectiveness. To ensure the model's robustness and versatility, diverse sound data is meticulously acquired using specific tools, including Raspberry Pi 3 and 2mic. Evaluation and Results Beyond mere implementation, the research conducts thorough evaluations, assessing the accuracy and efficiency of the proposed system under various environmental conditions. The results showcase promising accuracy rates, with an error rate ranging from 0.45% to 1.15% across diverse sample sizes, affirming the effectiveness of the computational auditory system. Significance and Applications The significance of this research extends beyond the immediate application, contributing to the evolving landscape of both computational audition and machine learning. The fusion of human-like sound localization mechanisms with the adaptability of deep learning models is poised to unlock new possibilities in fields such as robotics, assistive technologies, and virtual reality. Structure and Content Structured into four chapters, the thesis unfolds with an introductory exploration of the broader field of computer audition. Subsequent chapters delve into the theoretical foundations and implementation details of the spherical head model, providing a robust framework for sound localization. The intricate system design is elucidated, covering architecture, components, and methodologies, emphasizing the seamless integration with the Raspberry Pi environment. Conclusion In conclusion, this research aspires to propel the boundaries of what is achievable in the computational auditory realm. By converging the intricacies of human auditory perception with the robust capabilities of deep learning, and leveraging the accessibility of the Raspberry Pi platform, this study aims to not only advance the field of sound localization but also to foster innovations in human-computer interaction and technological accessibility.

Benzer Tezler

  1. Lifelong learning for auditory scene analysis

    İşitsel sahne analizi için hayat boyu öğrenme

    BARIŞ BAYRAM

    Doktora

    İngilizce

    İngilizce

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. GÖKHAN İNCE

  2. Ego noise estimation for robot audition

    Başlık çevirisi yok

    GÖKHAN İNCE

    Doktora

    İngilizce

    İngilizce

    2011

    Makine MühendisliğiTokyo Institute of Technology

    PROF. JUNİCHİ IMURA

  3. Identification of object manipulation anomalies for service robots

    Servis robotları için nesne etkileşim anomalilerinin tanısı

    DOĞAN ALTAN

    Doktora

    İngilizce

    İngilizce

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. SANEM SARIEL UZER

  4. Paralel mekanizmalı ayak bileği rehabilitasyon robotu üzerinde kontrol stratejilerinin geliştirilmesi ve uygulanması

    Development and implementation of control strategies on a parallel mechanism ankle rehabilitation robot

    MUSTAFA ŞİNASİ AYAS

    Doktora

    Türkçe

    Türkçe

    2017

    Elektrik ve Elektronik MühendisliğiKaradeniz Teknik Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    PROF. DR. İSMAİL HAKKI ALTAŞ

  5. Değişken parametreli bir alt ekstremite güçlendirme robotunun mekanik tasarımı ve ileri kontrol algoritmalarının uygulanması

    Mechanical design and implementation of advanced control algorithms of a variable parametered strengthening lower-extremity exoskeleton

    ALPER KADİR TANYILDIZI

    Doktora

    Türkçe

    Türkçe

    2018

    Makine MühendisliğiFırat Üniversitesi

    Makine Mühendisliği Ana Bilim Dalı

    DOÇ. OĞUZ YAKUT