Geri Dön

Audıo deep fake detectıon usıng deep learnıng

Derin öğrenme kullanarak ses derin sahtekarı algılama

  1. Tez No: 952523
  2. Yazar: OUSAMA A SHAABAN
  3. Danışmanlar: Prof. Dr. REMZİ YILDIRIM
  4. Tez Türü: Doktora
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2025
  8. Dil: İngilizce
  9. Üniversite: Ankara Yıldırım Beyazıt Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği ve Enformatik Bilimler Ana Bilim Dalı
  12. Bilim Dalı: Bilgisayar Bilimi ve Mühendisliği Bilim Dalı
  13. Sayfa Sayısı: 146

Özet

Yapay zekâ teknikleri kullanılarak üretilen ses taklitler, bilgi güvenilirliği açısından ciddi bir tehdit oluşturmaktadır. Lojistik regresyon, kuadratik destek vektör makineleri (Q-SVM) ve destek vektör makineleri (SVM) gibi klasik makine öğrenmesi (ML) modellerinin yanı sıra, evrişimli sinir ağları (CNN) ve çift yönlü uzun-kısa süreli bellek (BiLSTM) gibi derin öğrenme (DL) yaklaşımlarını içeren mevcut tespit algılama yöntemleri kapsamlı ön işleme ve özellik çıkarmayı gerektirir ve bu da veri kümeleri arasında uyarlanabilirliği sınırlar. Bu çalışma, bu zorlukların üstesinden gelmek için yeni bir Siamese CNN tabanlı Ses Taklidi Algılama Modeli önermektedir. Model, gerçek ve sahte ses örneklerini paralel olarak işlemek için iki özdeş CNN dalı kullanır. Her bir dal, bir öz-dikkat modülü ve artık bağlantı içerir; çıkışlar, gerçek ve manipüle edilmiş ses sinyalleri arasındaki farkları belirlemek için karşıt kayıp fonksiyonu kullanılarak karşılaştırılır. Bu araştırma, literatür taraması, veri kümesi oluşturma, model geliştirme ve kapsamlı değerlendirmeyi içeren yapılandırılmış bir metodoloji izlemektedir. Önerilen model, dayanıklılığını ve etkinliğini sağlamak amacıyla klasik ML ve DL yöntemlerine karşı titizlikle test edilmiştir. Bu çalışma, Siamese CNN'lerinden yararlanarak mevcut kısıtlamaların ötesine geçen, doğruluk ve uyarlanabilirliği artıran gelişmiş bir algılama çerçevesi sunar. Beklenen katkılar arasında son teknoloji bir tespit modeli ve taklidi algılama iyileştirmeye yönelik değerli görüşler sağlayan kapsamlı bir karşılaştırmalı analiz yer almaktadır. Bu araştırma, ortaya çıkan taklit algılama tehditlerine karşı koymak için paydaşlara gelişmiş araçlar sağlayarak dijital ses içeriğinin bütünlüğünü güçlendirmektedir.

Özet (Çeviri)

Audio deepfakes, generated using AI techniques, pose a significant threat to information authenticity. Existing detection methods, including classical machine learning (ML) models such as logistic regression, quadratic support vector machine (Q-SVM), and support vector machines (SVM), as well as deep learning (DL) approaches like convolutional neural networks (CNNs) and bidirectional long short-term memory (BiLSTM), require extensive preprocessing and feature extraction, limiting adaptability across datasets. This study proposes a novel Siamese CNN-based Audio Deepfake Detection Model to address these challenges. The model employs two identical CNN branches to process real and fake audio samples in parallel. Each branch incorporates a self-attention module and a residual connection, with outputs compared using a contrastive loss function to identify differences between genuine and manipulated audio signals. The research follows a structured methodology encompassing literature review, dataset curation, model development, and extensive evaluation. The proposed model is rigorously tested against classical ML and DL counterparts to ensure its robustness and effectiveness. By leveraging Siamese CNNs, this study introduces an advanced detection framework that surpasses current limitations, enhancing accuracy and adaptability. The expected contributions include a state-of-the-art detection model and a comprehensive comparative analysis, providing valuable insights into improving deepfake detection. This research equips stakeholders with advanced tools to counteract emerging deepfake threats, reinforcing the integrity of digital audio content.

Benzer Tezler

  1. Sahte multimedya üretimi ve sahte multimedya tespiti

    Fake multimedia generation and fake multimedia detection

    MARAT UTEPKALIYEV

    Yüksek Lisans

    Türkçe

    Türkçe

    2025

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolMilli Savunma Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. AYTUĞ BOYACI

  2. Öz denetimli öğrenme yaklaşımları ile derin sahte ses ve görüntü maniplasyonunun tespiti

    Detection of deepfake audio and image manuplation with self-supervised learning approach

    MERVE YILDIRIM

    Yüksek Lisans

    Türkçe

    Türkçe

    2025

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolFırat Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. İLHAN AYDIN

  3. Transformer-based deepfake detection methods

    Görü dönüştürücü temelli derin sahte tespiti yöntemleri

    GÖKHAN YILDIRIM

    Yüksek Lisans

    İngilizce

    İngilizce

    2025

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ BERK GÖKBERK

  4. Derin öğrenme yöntemleri kullanılarak deepfake medya dosyalarının tespiti

    Detection of deepfake media files using deep learning methods

    RIFAT KÖSE

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKastamonu Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ MURAT MERİÇELLİ

  5. Deepfake video analysis and detection

    Deepfake video analizi ve tespiti

    FARMANUDDIN FARMAN

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi Üniversitesi

    Bilgisayar Bilimleri Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ÇAĞRI ŞAHİN