Development of an IoT based environmental sound event recognition methods using wireless acoustic sensor networks in smart cities
Akıllı şehirlerde kablosuz akustik sensör ağları kullanarak çevresel ses olayı tanıma yöntemlerinin IoT tabanlı geliştirilmesi
- Tez No: 919321
- Danışmanlar: DOÇ. DR. ORHAN YAMAN
- Tez Türü: Yüksek Lisans
- Konular: Bilim ve Teknoloji, Science and Technology
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2025
- Dil: İngilizce
- Üniversite: Fırat Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Adli Bilişim Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 96
Özet
Bu çalışma, ESP32 cihazıyla kaydedilen özel bir veri seti ve kamuya açık ESC-10 veri setini kullanarak çeşitli yaklaşımları değerlendirmek suretiyle çevresel ses sınıflandırmasını geliştirmeyi amaçlamaktadır. Özel veri seti,“havaalanı, plaj, uçak, otoyol, lobi, konak, ofis ve restoran”olmak üzere sekiz kategori içerirken, ESC-10 veri seti 10 sınıfta toplam 400 kısa kayıttan oluşmaktadır. Birinci yöntem, transfer öğrenmesini kullanarak, önceden eğitilmiş DarkNet53 model ile ses kayıtlarının Mel-spektrogram ve gri tonlamalı görüntülere dönüştürülmesi yoluyla özellik çıkarma potansiyelini ortaya koymuştur. ESC-10 veri setinde %97.24 doğruluk oranı elde eden bu model, önceden eğitilmiş konvolüsyonel sinir ağlarının (CNN) nispeten küçük veri setlerini işleme, hesaplama karmaşıklığını azaltma ve rekabetçi sonuçlar elde etme konusundaki adaptasyon yeteneğini ve verimliliğini göstermiştir. İkinci yöntem, özel veri seti üzerinde Gelişmiş Sinir Ağı Mimarileri olan Uzun Kısa Süreli Bellek (LSTM), Çift Yönlü Uzun Kısa Süreli Bellek (Bi-LSTM) ve CNN modellerini değerlendirmiştir. Bi-LSTM üstün bir performans sergileyerek bağlamsal öğrenme ve zamansal bağımlılıkları yakalama konusundaki güçlü yeteneğini ortaya koymuştur. Bu yöntemle Bi-LSTM, %99.4'lük en yüksek eğitim doğruluğu ve %97'lik test doğruluğuna ulaşmıştır. Bu sonuçlar, ses verilerinin özel özelliklerine uygun esnek model mimarilerinin önemini vurgulamaktadır. Son yöntem, Mel Frekans Kepstral Katsayıları (MFCC) ve Destek Vektör Makineleri (SVM) uygulamasına odaklanmış, özellik çıkarma ve segmentasyon süresinin etkisini incelemiştir. Bu yöntem, 10 saniyelik segmentasyon ile istatistiksel MFCC özellikleri kullanılarak %97.39'luk maksimum test doğruluğuna ulaşmıştır. Bulgular, sınıflandırma görevlerini yönetmede ve doğruluğu artırmada özellik çıkarma ve uzatılmış segmentasyonun önemini ortaya koymaktadır. Bu araştırma, farklı metodolojilerin entegrasyonu yoluyla pratik uygulamalar için kesin ve güvenilir çevresel ses sınıflandırma sistemlerinin oluşturulmasını büyük ölçüde geliştirmektedir.
Özet (Çeviri)
This study aims to enhance environmental sound classification by evaluating several approaches with a custom dataset recoded with Esp32 device and the publicly accessible ESC-10 dataset. The custom dataset has eight categories: airport, beach, aircraft, highway, lobby, lodge, office, and restaurant, whereas the ESC-10 dataset consists of 400 brief recordings across 10 classes. The first method, used transfer learning with the pre-trained DarkNet53 model, the potential of converting sound recordings into Mel-spectrogram and gray-scale images for feature extraction. Achieving a 97.24% accuracy on the ESC-10 dataset, this model outshined the adaptability and efficiency of pre-trained convolutional neural networks (CNNs) in handling relatively small datasets, reducing computational complexity, and achieving competitive results. The second method showed the advanced neural network architectures, considering Long Short-Term Memory (LSTM) Bidirectional Long Short-Term Memory (Bi-LSTM) and CNN models, on the custom dataset. Bi-LSTM achieved superior performance, showing its super capability for contextual learning and capturing temporal dependencies. These results highlight the importance of flexible model architectures to the specific characteristics of the sound data, with Bi-LSTM achieving the highest training accuracy of 99.4% and test accuracy of 97%. The final method emphasized the application of Mel-Frequency Cepstral Coefficients (MFCC) in conjunction with Support Vector Machines (SVM), concentrating on the impact of feature extraction and segmentation duration. This method achieved a peak test accuracy of 97.39% by employing statistical MFCC features with a 10-second segmentation. The findings underscore the significance of feature extraction and extended segmentation in managing classification jobs and enhancing accuracy. This research greatly enhances the creation of precise and dependable environmental sound classification systems for practical applications through the integration of different methodologies.
Benzer Tezler
- Düşük güçlü ve kayıplı kablosuz sensör ağlarında topolojinin ağ kurulumunda enerji tüketimine etkisi
The effect of network installation on low power and lossy wireless sensor networks on energy consumption
NAMIK CEYLAN
Yüksek Lisans
Türkçe
2025
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
PROF. DR. SIDDIKA BERNA ÖRS YALÇIN
- Sualtı nesnelerinin interneti için multistatik sonar sensör ağlarında üç boyutlu kapsama dağıtım ve ağ optimizasyonu
Three-dimensional coverage deployment and network optimization in multistatic sonar sensor networks for the internet of underwater things
ALPER AVCIOĞLU
Doktora
Türkçe
2023
Mühendislik BilimleriGazi ÜniversitesiBilişim Sistemleri Ana Bilim Dalı
PROF. DR. ÖMER FARUK BAY
DR. ALPER BEREKETLİ
- Çoklu ürün ekosistemlerinde kullanıcı deneyimi: Akıllı banyo baskülleri üzerinden bir inceleme
User experience in multi-device ecosystems: An evaluation on connected smart scales
CEYDA BAŞ
Yüksek Lisans
Türkçe
2020
Endüstri Ürünleri Tasarımıİstanbul Teknik ÜniversitesiEndüstri Ürünleri Tasarımı Ana Bilim Dalı
DR. ÖĞR. ÜYESİ EKREM CEM ALPPAY
- Fotovoltaik sistemlerde tozlanmaya bağlı enerji kayıplarının incelenmesi için IOT tabanlı bir ölçüm sisteminin geliştirilmesi
Development of an IOT-based measurement system for investi̇gating energy losses due to dust in photovoltaic systems
OĞUZHAN COŞKUN
Yüksek Lisans
Türkçe
2025
EnerjiBursa Teknik ÜniversitesiEnerji Sistemleri Mühendisliği Ana Bilim Dalı
DOÇ. DR. GÖKAY BAYRAK
- Elektrik pano yangınlarına karşı nesnelerin interneti destekli algılama sisteminin geliştirilmesi
Development of an internet of things supported detection system against electric panel fires
MUHAMMED FATİH PEKŞEN
Doktora
Türkçe
2024
Mühendislik BilimleriSakarya ÜniversitesiYangın ve Yangın Güvenliği Anabilim Dalı
PROF. DR. YILMAZ UYAROĞLU