Geri Dön

Development of an IoT based environmental sound event recognition methods using wireless acoustic sensor networks in smart cities

Akıllı şehirlerde kablosuz akustik sensör ağları kullanarak çevresel ses olayı tanıma yöntemlerinin IoT tabanlı geliştirilmesi

  1. Tez No: 919321
  2. Yazar: YUSUF YAU ALI
  3. Danışmanlar: DOÇ. DR. ORHAN YAMAN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilim ve Teknoloji, Science and Technology
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2025
  8. Dil: İngilizce
  9. Üniversite: Fırat Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Adli Bilişim Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 96

Özet

Bu çalışma, ESP32 cihazıyla kaydedilen özel bir veri seti ve kamuya açık ESC-10 veri setini kullanarak çeşitli yaklaşımları değerlendirmek suretiyle çevresel ses sınıflandırmasını geliştirmeyi amaçlamaktadır. Özel veri seti,“havaalanı, plaj, uçak, otoyol, lobi, konak, ofis ve restoran”olmak üzere sekiz kategori içerirken, ESC-10 veri seti 10 sınıfta toplam 400 kısa kayıttan oluşmaktadır. Birinci yöntem, transfer öğrenmesini kullanarak, önceden eğitilmiş DarkNet53 model ile ses kayıtlarının Mel-spektrogram ve gri tonlamalı görüntülere dönüştürülmesi yoluyla özellik çıkarma potansiyelini ortaya koymuştur. ESC-10 veri setinde %97.24 doğruluk oranı elde eden bu model, önceden eğitilmiş konvolüsyonel sinir ağlarının (CNN) nispeten küçük veri setlerini işleme, hesaplama karmaşıklığını azaltma ve rekabetçi sonuçlar elde etme konusundaki adaptasyon yeteneğini ve verimliliğini göstermiştir. İkinci yöntem, özel veri seti üzerinde Gelişmiş Sinir Ağı Mimarileri olan Uzun Kısa Süreli Bellek (LSTM), Çift Yönlü Uzun Kısa Süreli Bellek (Bi-LSTM) ve CNN modellerini değerlendirmiştir. Bi-LSTM üstün bir performans sergileyerek bağlamsal öğrenme ve zamansal bağımlılıkları yakalama konusundaki güçlü yeteneğini ortaya koymuştur. Bu yöntemle Bi-LSTM, %99.4'lük en yüksek eğitim doğruluğu ve %97'lik test doğruluğuna ulaşmıştır. Bu sonuçlar, ses verilerinin özel özelliklerine uygun esnek model mimarilerinin önemini vurgulamaktadır. Son yöntem, Mel Frekans Kepstral Katsayıları (MFCC) ve Destek Vektör Makineleri (SVM) uygulamasına odaklanmış, özellik çıkarma ve segmentasyon süresinin etkisini incelemiştir. Bu yöntem, 10 saniyelik segmentasyon ile istatistiksel MFCC özellikleri kullanılarak %97.39'luk maksimum test doğruluğuna ulaşmıştır. Bulgular, sınıflandırma görevlerini yönetmede ve doğruluğu artırmada özellik çıkarma ve uzatılmış segmentasyonun önemini ortaya koymaktadır. Bu araştırma, farklı metodolojilerin entegrasyonu yoluyla pratik uygulamalar için kesin ve güvenilir çevresel ses sınıflandırma sistemlerinin oluşturulmasını büyük ölçüde geliştirmektedir.

Özet (Çeviri)

This study aims to enhance environmental sound classification by evaluating several approaches with a custom dataset recoded with Esp32 device and the publicly accessible ESC-10 dataset. The custom dataset has eight categories: airport, beach, aircraft, highway, lobby, lodge, office, and restaurant, whereas the ESC-10 dataset consists of 400 brief recordings across 10 classes. The first method, used transfer learning with the pre-trained DarkNet53 model, the potential of converting sound recordings into Mel-spectrogram and gray-scale images for feature extraction. Achieving a 97.24% accuracy on the ESC-10 dataset, this model outshined the adaptability and efficiency of pre-trained convolutional neural networks (CNNs) in handling relatively small datasets, reducing computational complexity, and achieving competitive results. The second method showed the advanced neural network architectures, considering Long Short-Term Memory (LSTM) Bidirectional Long Short-Term Memory (Bi-LSTM) and CNN models, on the custom dataset. Bi-LSTM achieved superior performance, showing its super capability for contextual learning and capturing temporal dependencies. These results highlight the importance of flexible model architectures to the specific characteristics of the sound data, with Bi-LSTM achieving the highest training accuracy of 99.4% and test accuracy of 97%. The final method emphasized the application of Mel-Frequency Cepstral Coefficients (MFCC) in conjunction with Support Vector Machines (SVM), concentrating on the impact of feature extraction and segmentation duration. This method achieved a peak test accuracy of 97.39% by employing statistical MFCC features with a 10-second segmentation. The findings underscore the significance of feature extraction and extended segmentation in managing classification jobs and enhancing accuracy. This research greatly enhances the creation of precise and dependable environmental sound classification systems for practical applications through the integration of different methodologies.

Benzer Tezler

  1. Düşük güçlü ve kayıplı kablosuz sensör ağlarında topolojinin ağ kurulumunda enerji tüketimine etkisi

    The effect of network installation on low power and lossy wireless sensor networks on energy consumption

    NAMIK CEYLAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2025

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    PROF. DR. SIDDIKA BERNA ÖRS YALÇIN

  2. Sualtı nesnelerinin interneti için multistatik sonar sensör ağlarında üç boyutlu kapsama dağıtım ve ağ optimizasyonu

    Three-dimensional coverage deployment and network optimization in multistatic sonar sensor networks for the internet of underwater things

    ALPER AVCIOĞLU

    Doktora

    Türkçe

    Türkçe

    2023

    Mühendislik BilimleriGazi Üniversitesi

    Bilişim Sistemleri Ana Bilim Dalı

    PROF. DR. ÖMER FARUK BAY

    DR. ALPER BEREKETLİ

  3. Çoklu ürün ekosistemlerinde kullanıcı deneyimi: Akıllı banyo baskülleri üzerinden bir inceleme

    User experience in multi-device ecosystems: An evaluation on connected smart scales

    CEYDA BAŞ

    Yüksek Lisans

    Türkçe

    Türkçe

    2020

    Endüstri Ürünleri Tasarımıİstanbul Teknik Üniversitesi

    Endüstri Ürünleri Tasarımı Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ EKREM CEM ALPPAY

  4. Fotovoltaik sistemlerde tozlanmaya bağlı enerji kayıplarının incelenmesi için IOT tabanlı bir ölçüm sisteminin geliştirilmesi

    Development of an IOT-based measurement system for investi̇gating energy losses due to dust in photovoltaic systems

    OĞUZHAN COŞKUN

    Yüksek Lisans

    Türkçe

    Türkçe

    2025

    EnerjiBursa Teknik Üniversitesi

    Enerji Sistemleri Mühendisliği Ana Bilim Dalı

    DOÇ. DR. GÖKAY BAYRAK

  5. Elektrik pano yangınlarına karşı nesnelerin interneti destekli algılama sisteminin geliştirilmesi

    Development of an internet of things supported detection system against electric panel fires

    MUHAMMED FATİH PEKŞEN

    Doktora

    Türkçe

    Türkçe

    2024

    Mühendislik BilimleriSakarya Üniversitesi

    Yangın ve Yangın Güvenliği Anabilim Dalı

    PROF. DR. YILMAZ UYAROĞLU