Geri Dön

İşitsel sahnelerin tanınması için çevresel ses analizi

Audio event analysis for auditory scene recognition

  1. Tez No: 382316
  2. Yazar: SELVER EZGİ KÜÇÜKBAY
  3. Danışmanlar: YRD. DOÇ. DR. MUSTAFA SERT
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2015
  8. Dil: Türkçe
  9. Üniversite: Başkent Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 88

Özet

Ses verileri, içerisinde birçok ses türünü barındırır ve çokluortam uygulamaları için önemli bir kaynaktır. Bu çalışmada ofis ortamından alınmış 16 ayrık ses olayının (alarm, boğaz temizleme, öksürük, kapı çarpması, çekmece, klavye, anahtar, kapı vurma, gülme, bilgisayar faresi, sayfa çevirme, nesnenin masaya çarpması, telefon, yazıcı, konuşma ve elektrik düğmesi) analizi ve sezimi sağlanmıştır. Bununla birlikte 10 işitsel sahnenin (otobüs, kalabalık sokak, ofis ortamı, açık market, park, sessiz sokak, restoran, süpermarket, tren ve tren istasyonu) ayrık olarak sınıflandırılması gerçekleştirilmiştir. Ayrıca, sezimlenen ses olayları ile veri kümesindeki“ofis”işitsel sahnesi arasındaki ilintiler incelenmiştir. Ses örneklerinin içerik tanımlaması için Mel frequency cepstral coefficient (MFCC) özniteliği, Destek Vektör Makineleri (DVM) öğrenme algoritması ile birlikte kullanılmıştır. MFCC ve DVM için parametre eniyilemesi yapılmış ve öznitelik çıkarımı için uyarlamalı bir frekans analiz yöntemi önerilmiştir.

Özet (Çeviri)

Audio data contains several sound types and is important source for multimedia applications. In this thesis, we present a system for analysing and detecting 16 distinct audio events namely; alert, clear throat, cough, door slam, drawer, keyboard, keys, knock, laughter, mouse, pageturn, pen drop, phone, printer, speeh and switch that are collected from office live environments. The recognition of 10 different auditory scenes (bus, busy street, office, open airmarket, park, quiet street, restaurant, supermarket, tube and tubestation) is also performed in the study. Moreover, correlations between audio scenes and audio events are investigated. Support Vector Machine (SVM) classifier along with the Mel Frequency Cepstral Coefficient (MFCC) feature are used throgh the analyses. In addition, we propose an adaptive frequency analysis scheme for feature extraction and perform optimizations for feature representation and classifier design.

Benzer Tezler

  1. Lifelong learning for auditory scene analysis

    İşitsel sahne analizi için hayat boyu öğrenme

    BARIŞ BAYRAM

    Doktora

    İngilizce

    İngilizce

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. GÖKHAN İNCE

  2. Schiller ve İtalyan operası

    Schiller and Italian opera

    AYŞE SİNEM EKŞİOĞLU

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    MüzikMimar Sinan Güzel Sanatlar Üniversitesi

    Sahne Sanatları Ana Sanat Dalı

    DOÇ. DR. İLKE BORAN

  3. A review of spatial auditory scene assessment approaches

    Mekan bazlı işıtsel sahnelerın analızı üzerıneyaklaşımların bır değerlendırmesı

    KRISTINA GOLUBKOVA

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Müzikİhsan Doğramacı Bilkent Üniversitesi

    Müzik Bilim Dalı

    DOÇ. DR. ONUR TÜRKMEN

  4. Genç erişkinlerde statik ve dinamik sanal işitsel sahnelerin postüral stabiliteye etkisi

    Effects of static and dynamic virtual auditory scenes on postural stability in young adults

    TALHA ÇÖGEN

    Yüksek Lisans

    Türkçe

    Türkçe

    2020

    Kulak Burun ve Boğazİstanbul Üniversitesi-Cerrahpaşa

    Odyoloji Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ EYYUP KARA

  5. Spherical vision transformers for audio-visual saliency prediction in 360◦ videos

    360◦ videolarda görsel-işitsel belirginlik tahmini için küresel görüntü dönüştürücüleri

    MERT ÇÖKELEK

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKoç Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. İBRAHİM AYKUT ERDEM