İşitsel sahnelerin tanınması için çevresel ses analizi
Audio event analysis for auditory scene recognition
- Tez No: 382316
- Danışmanlar: YRD. DOÇ. DR. MUSTAFA SERT
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2015
- Dil: Türkçe
- Üniversite: Başkent Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 88
Özet
Ses verileri, içerisinde birçok ses türünü barındırır ve çokluortam uygulamaları için önemli bir kaynaktır. Bu çalışmada ofis ortamından alınmış 16 ayrık ses olayının (alarm, boğaz temizleme, öksürük, kapı çarpması, çekmece, klavye, anahtar, kapı vurma, gülme, bilgisayar faresi, sayfa çevirme, nesnenin masaya çarpması, telefon, yazıcı, konuşma ve elektrik düğmesi) analizi ve sezimi sağlanmıştır. Bununla birlikte 10 işitsel sahnenin (otobüs, kalabalık sokak, ofis ortamı, açık market, park, sessiz sokak, restoran, süpermarket, tren ve tren istasyonu) ayrık olarak sınıflandırılması gerçekleştirilmiştir. Ayrıca, sezimlenen ses olayları ile veri kümesindeki“ofis”işitsel sahnesi arasındaki ilintiler incelenmiştir. Ses örneklerinin içerik tanımlaması için Mel frequency cepstral coefficient (MFCC) özniteliği, Destek Vektör Makineleri (DVM) öğrenme algoritması ile birlikte kullanılmıştır. MFCC ve DVM için parametre eniyilemesi yapılmış ve öznitelik çıkarımı için uyarlamalı bir frekans analiz yöntemi önerilmiştir.
Özet (Çeviri)
Audio data contains several sound types and is important source for multimedia applications. In this thesis, we present a system for analysing and detecting 16 distinct audio events namely; alert, clear throat, cough, door slam, drawer, keyboard, keys, knock, laughter, mouse, pageturn, pen drop, phone, printer, speeh and switch that are collected from office live environments. The recognition of 10 different auditory scenes (bus, busy street, office, open airmarket, park, quiet street, restaurant, supermarket, tube and tubestation) is also performed in the study. Moreover, correlations between audio scenes and audio events are investigated. Support Vector Machine (SVM) classifier along with the Mel Frequency Cepstral Coefficient (MFCC) feature are used throgh the analyses. In addition, we propose an adaptive frequency analysis scheme for feature extraction and perform optimizations for feature representation and classifier design.
Benzer Tezler
- Lifelong learning for auditory scene analysis
İşitsel sahne analizi için hayat boyu öğrenme
BARIŞ BAYRAM
Doktora
İngilizce
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. GÖKHAN İNCE
- Schiller ve İtalyan operası
Schiller and Italian opera
AYŞE SİNEM EKŞİOĞLU
Yüksek Lisans
Türkçe
2019
MüzikMimar Sinan Güzel Sanatlar ÜniversitesiSahne Sanatları Ana Sanat Dalı
DOÇ. DR. İLKE BORAN
- A review of spatial auditory scene assessment approaches
Mekan bazlı işıtsel sahnelerın analızı üzerıneyaklaşımların bır değerlendırmesı
KRISTINA GOLUBKOVA
Yüksek Lisans
İngilizce
2022
Müzikİhsan Doğramacı Bilkent ÜniversitesiMüzik Bilim Dalı
DOÇ. DR. ONUR TÜRKMEN
- Genç erişkinlerde statik ve dinamik sanal işitsel sahnelerin postüral stabiliteye etkisi
Effects of static and dynamic virtual auditory scenes on postural stability in young adults
TALHA ÇÖGEN
Yüksek Lisans
Türkçe
2020
Kulak Burun ve Boğazİstanbul Üniversitesi-CerrahpaşaOdyoloji Ana Bilim Dalı
DR. ÖĞR. ÜYESİ EYYUP KARA
- Spherical vision transformers for audio-visual saliency prediction in 360◦ videos
360◦ videolarda görsel-işitsel belirginlik tahmini için küresel görüntü dönüştürücüleri
MERT ÇÖKELEK
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKoç ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. İBRAHİM AYKUT ERDEM