Geri Dön

Active audio-visual human tracking for robots

Robotlar için aktif işitsel-görsel insan takibi

  1. Tez No: 397974
  2. Yazar: BARIŞ BAYRAM
  3. Danışmanlar: YRD. DOÇ. DR. GÖKHAN İNCE
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2015
  8. Dil: İngilizce
  9. Üniversite: İstanbul Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 75

Özet

Bu tezde, işitsel ve/veya görsel olarak karmaşık çevreler ve şartlar altında robotların algılama yetisini iyileştirmek için, çoklu kipli/sensörlü sistem tasarlanılmıştır. Gerçek zamanda koşan bu sistem 1) işitme kipi, bu kipe destek olması amacıyla 2) görme kipi ve bu iki kipten gelen verilere dayalı akıllı davranış örüntüleri yaratmak için önerilen 3) hareket kipi olmak üzere üç kipten oluşmaktadır. Ortamdaki konuşmacının tespiti, lokalizasyonu ve takibi, işitme ve görü kiplerinin, bağımsız olarak gerçekleştirdiği başlıca görevleridir

Özet (Çeviri)

In this thesis, a multimodal system is designed in the form of an active audio-visual perception in order to improve the perceptual capability of a robot in a noisy environment. The system running in real-time uses 1) audition modality, 2) a complementary vision modality and 3) motion modality incorporating intelligent behaviors based on the data obtained from both sensory modalities. In this system, the detection, localization and tracking of the speaker are the main tasks of audition and vision modalities independently.

Benzer Tezler

  1. Automatic extraction of affective multimodal face videos

    Duygu içerikli çok biçimli yüz videolarinin elde edilmesi için otomatik bir yöntem

    CAN KANSIN

    Yüksek Lisans

    İngilizce

    İngilizce

    2012

    Elektrik ve Elektronik MühendisliğiBahçeşehir Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ÇİĞDEM EROĞLU ERDEM

  2. Statistical facial feature extraction and lip segmentation

    İstatistiksel yüz öznitelik çıkarımı ve dudak bölümlemesi

    MUSTAFA BERKAY YILMAZ

    Yüksek Lisans

    İngilizce

    İngilizce

    2009

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSabancı Üniversitesi

    Mekatronik Mühendisliği Ana Bilim Dalı

    DOÇ. DR. MUSTAFA ÜNEL

    YRD. DOÇ. DR. HAKAN ERDOĞAN

  3. Sound of blase, sound of spirit, sound of war: soundtrack analysis of Reha Erdem films : Hayat Var, Kosmos, ve Jin.

    Bezginliğin, maneviyatın ve savaşın sesi : Reha Erdem filmlerinin ses bandı analizi : Hayat Var, Kosmos ve Jin

    GURUR ASİ

    Yüksek Lisans

    İngilizce

    İngilizce

    2016

    Sahne ve Görüntü Sanatlarıİzmir Ekonomi Üniversitesi

    Medya Ve İletişim Çalışmaları Ana Bilim Dalı

    PROF. DR. NEZİH ERDOĞAN

    YRD. DOÇ. DR. YÜKSEL GÖKÇEN KARANFİL

  4. Videokrasi: Dijital görsel kültür çağında kullanıcı motivasyonu kapsamında izleyici manipülasyonu

    Videocracy: Audience manipulation within user motivation in the age of digital visual culture

    BURAK EVREM TURP

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    İletişim BilimleriÇanakkale Onsekiz Mart Üniversitesi

    Disiplinlerarası Medya ve Kültürel Çalışmalar Anabilim Dalı

    DR. ÖĞR. ÜYESİ ARİF YILDIRIM

  5. Insan kaynakları yönetimine özürlü dostu bakış açıları: Küçükçekmece Belediyesi örneği

    Perspectives on disabled-friendly to human resource management: Küçükçekmece Municipality case

    ERKAN AYDEMİR

    Yüksek Lisans

    Türkçe

    Türkçe

    2012

    Çalışma Ekonomisi ve Endüstri İlişkileriSakarya Üniversitesi

    Çalışma Ekonomisi ve Endüstri İlişkileri Ana Bilim Dalı

    PROF. DR. ALİ SEYYAR