Geri Dön

Derin öğrenme ile ses sinyalinde gürültü azaltma

Noise reduction in sound signal with deep learning

  1. Tez No: 641420
  2. Yazar: MUSTAFA SELÇUK ÇAĞLAR
  3. Danışmanlar: YRD. DOÇ. DR. FİLİZ KARAÖMERLİOĞLU
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Elektrik ve Elektronik Mühendisliği, Computer Engineering and Computer Science and Control, Electrical and Electronics Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2020
  8. Dil: Türkçe
  9. Üniversite: Mersin Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 90

Özet

Derin öğrenme ile ses filtrelemenin amaçlandığı bu çalışmada CNN, Autoencoder, Resnet ve GAN yöntemleri kullanılarak ses filtreleme hedeflenmiştir. Bu tez kapsamında yapılan çalışmalar sadece ses sinyalini değil aynı zamanda tüm tek boyutlu sinyalleri işlemek üzere de kullanılabilir. Kullanılan mimari olabildiğince GAN ağları perceptron katmanından arındırılarak sadece CNN ile kurulmaya gayret edildi. Sincnet, Dinamik yönlendirme, Virtual batch norm gibi yeni kavramlar, ses filtrelemede sağlayabileceği katkılar göz önünde bulundurularak incelenmiştir. GAN stratejisinin iyi ve eksik olduğu yerler vurgulanmıştır. GAN ağlarından generator ağı Resnet ve CNN kavramları kullanılarak Autoencoder inşa edilmiş ve filtreleme yaparken olumlu sonuçlarla karşılaşılmıştır. Mimari değiştirilerek 3 farklı temel GAN elde edilmiştir. Yapay zekâ ağına eklenebilecek eklentilerle beraber yazılımda hiperparametrelerde yapılan değişikliklerle yeni sonuçlar elde edilebileceği belirtilmiştir.

Özet (Çeviri)

In this study, which aims to filter sound with deep learning, sound filtering is aimed by using CNN, Autoencoder, Resnet and GAN methods. Studies conducted within the scope of this thesis can be used to process not only the audio signal but also all one-dimensional signals. The architecture used was tried to be built with CNN only by removing GAN networks from the perceptron layer as much as possible. New concepts such as Sincnet, Dynamic orientation, Virtual batch norm have been examined by taking into account the contributions which can provide in sound filtering. Places where GAN strategy is good and incomplete are emphasized. Autoencoder was constructed from GAN networks using the generator network, Resnet and CNN concepts. While filtering, positive results were encountered. 3 different basic GANs were obtained by changing the architecture. It is stated that new results can be obtained by changes in hyperparameters in the software with the additions that can be added to the artificial intelligence network.

Benzer Tezler

  1. Classification of abnormal respiratory sounds using deep learning techniques

    Solunum seslerinin derin öğrenme yöntemleri ile sınıflandırılması

    AHAMADI ABDALLAH IDRISSE

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi Üniversitesi

    Bilgisayar Bilimleri Ana Bilim Dalı

    DOÇ. DR. OKTAY YILDIZ

  2. Derin öğrenme ile ses iyileştirilmesi

    Voice enhancement by deep learning

    MUSTAFA ERSEVEN

    Yüksek Lisans

    Türkçe

    Türkçe

    2018

    Elektrik ve Elektronik MühendisliğiYıldız Teknik Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ BÜLENT BOLAT

  3. Konuşmacı tanıma metinsel kayıt ve analiz sisteminin oluşturulması

    Creating a model for text-dependent speaker diarization

    AMMAR AHMED ABDO SAEED

    Yüksek Lisans

    Türkçe

    Türkçe

    2022

    Bilgi ve Belge YönetimiMuğla Sıtkı Koçman Üniversitesi

    Bilişim Sistemleri Mühendisliği Ana Bilim Dalı

    DOÇ. DR. HÜSEYİN GÜRÜLER

  4. İki kez sıkıştırılmış ses sinyallerinin analizi ve otomatik olarak tespit edilmesi

    Analysis and automatic detection of double compressed audio signals

    AYKUT BÜKER

    Doktora

    Türkçe

    Türkçe

    2023

    Elektrik ve Elektronik MühendisliğiBursa Teknik Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    DOÇ. DR. CEMAL HANİLÇİ

  5. CNN-based text-independent automatic speaker identification

    Evrişimsel sinir ağı tabanlı metinden bağımsız otomatik konuşmacı tanılama

    MANDANA FASOUNAKI

    Yüksek Lisans

    İngilizce

    İngilizce

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ GÖKHAN İNCE