Geri Dön

Yapay sinir ağları ile konuşmacı doğrulama sistemleri için saldırı tespiti

Using artificial neural network on anti-spoofing for speaker verification

  1. Tez No: 533806
  2. Yazar: BEKİR BAKAR
  3. Danışmanlar: DOÇ. DR. CEMAL HANİLÇİ
  4. Tez Türü: Yüksek Lisans
  5. Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2018
  8. Dil: Türkçe
  9. Üniversite: Bursa Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 50

Özet

Kimlik kartları, manyetik kartlar gibi geleneksel ve eski şifreleme yöntemlerinin doğurduğu bazı olumsuz sonuçlar kişi veya kurumları alternatif şifreleme yöntemleri arayışına yöneltmiştir. Bir bireyin yüz, parmak izi, iris, avuç içi damar haritası, retina gibi fizyolojik veya yürüyüş biçimi, imza şekli, sesi gibi davranışsal özelliklerine biyometri denir. Biyometrik verileri kullanarak kimlik tespiti yapmayı hedefleyen sistemler ise, biyometrik doğrulama sistemleri olarak adlandırılır. Ses sinyalinin barındırdığı birçok kullanışlı bilgi ve bu bilgilerden elde edilen benzersiz çıktılar, verilen bir ses sinyalinin iddia edilen kişiye ait olup olmadığının tespit edilmesini hedefleyen, konuşmacı doğrulama (KD) sistemlerini cazip bir biyometrik sistem haline getirmiştir. KD sistemlerinin kullanımının yaygınlaşması, sistemleri yanıltma çabalarını da beraberinde getirmiştir. Saldırgan diye adlandırılan bir kişi, KD sistemlerini yanıltmak için birçok yöntem kullanabilir. Bu yöntemlerden en basit, fakat bir o kadar da etkili olanı tekrar oynatma (TO) saldırısıdır. TO saldırısı daha önceden kaydedilmiş bir ses kaydının, KD sisteminin algılayıcı, mikrofon seviyesinden tekrar oynatılmasıdır. KD sistemlerinin güvenilirliğini ciddi bir şekilde tehdit ettiği yapılan çalışmalarda gösterilen TO saldırıları, bu tez çalışmanın temel konusudur. Bu tez çalışmasında, KD sistemlerinde yaygın olarak kullanılan mel-frekansı kepstrum katsayıları, Otomatik Konuşmacı Doğrulama Yanıltma Saldırıları ve Karşı Önlemler (ASVspoof 2017) yarışmasında başarısı kanıtlanan sabit Q kepstral katsayıları ve uzun dönem ortalama spektrum (UDOS) öznitelikleri kullanılmıştır. Deneyler sırasında ASVspoof 2017 yarışması için hazırlanan veri tabanı kullanılmıştır. Sınıflandırıcı olarak ise, Gauss karışım modelinin yanı sıra; son yıllarda hemen her alanda kullanımı yaygınlaşan yapay sinir ağları (YSA) yaklaşımı esas alınmıştır. Bu tez çalışmasında, bahsedilen öznitelik ve sınıflandırıcılardan oluşan TO saldırı tespit sistemlerinin oluşturulması ve bu sistemlerin performanslarının detaylı olarak karşılaştırılması yapılmıştır. UDOS özniteliklerinin, YSA yaklaşımı kullanılarak sınıflandırılması en iyi saldırı tespit sistemi olmuştur. Bu sistem geliştirme ve değerlendirme kümesi verileri için sırasıyla; %4,10 ve %20,77 eşit hata oranı üretmiştir. Ayrıca, alt-band frekans analizi yapılmış ve yüksek frekans bölgesinin tekrar saldırısı oluşturma senaryosunda en çok etkilenen bölge olduğu; yani yüksek frekans bölgesi analizinin TO saldırısı tespitinde önemli bir rol oynadığı gösterilmiştir. Ortalama ve varyans normalizasyonu işleminin ise etkili bir yöntem olup olmadığı da araştırılmış; etkili bir yöntem olmadığı gözlemlenmiştir.

Özet (Çeviri)

Some negative consequences of traditional and old authentication methods such as ID cards and magnetic cards have led people or institutions to search for alternative authentication methods. Physiological characteristics of an individual such as face, fingerprint, iris, palm vein map and retina or behavioral characteristics such as walking pattern, signature form, sound are called as biometrics. So systems that aim to identify of an indivudual using his/her biometrics are referred to as biometric verification systems. Since speech signal conveys many useful information which yields unique outputs from these information, automatic speaker verification systems (ASV) which aims to determine whether a given speech signal belongs to the claimed person or not, have become an attractive biometric system. The widespread use of the ASV system has led to efforts to spoof the systems. A person called a fraud may use many methods to spoof ASV systems. The simplest of these methods yet the most effective is the replay attack. The replay attack can be described as re-playing a previously recorded speech of a target/genuine speaker to the ASV system from the sensor, the microphone level. The main focus of this dissertation is replay attack which is proved in many studies that have seriously threatened the reliability of ASV systems. In this dissertation study, the mel frerquency cepstral coefficients (MFCC) widely used in ASV systems, constant Q cepstral coefficients (CQCC) that is shown its succes in Automatic Speaker verification Spoofing and Countermasures Challenge (ASVspoof 2017) competition and long-term average spectrum (LTAS) are used. The experiments were conducted using the database prepared for ASVspoof 2017 competition. As a classifier, besides Gaussian mixture model (GMM); artificial neural network (ANN) approach has been used since it is in almost all areas in recent years. In this thesis, replay attack detection system that consist of classifers and features that mention are developed and compared in detail. The best anti-spoofing system has been LTAS features when classified using ANN. This system has produced 4,10% and 20,77% equal error rate (EER) for the development and the evaluation dataset, respectively. In addition, sub-band frequency analysis is performed and found that the high frequency region is the most affected region in the relay attack scenario; it has been shown that high frequency region analysis plays an important role in the detection of replay attack. It was also investigated whether the mean and variance normalization procedure were effective methods during experimental studies and was observed that there was no effective method.

Benzer Tezler

  1. CNN-based text-independent automatic speaker identification

    Evrişimsel sinir ağı tabanlı metinden bağımsız otomatik konuşmacı tanılama

    MANDANA FASOUNAKI

    Yüksek Lisans

    İngilizce

    İngilizce

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ GÖKHAN İNCE

  2. Voice recognition system with score level fusion methods and embedded system design

    Skor seviyesi füzyon metotları ile ses tanıma sistemi ve gömülü sistem tasarımı

    CİHAN AKIN

    Yüksek Lisans

    İngilizce

    İngilizce

    2019

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    DOÇ. MÜRVET KIRCI

  3. Two-stage decision making algorithm for speaker verification

    Ses ile kimlik doğrulama uygulamaları için iki aşamalı karar verme algoritması

    EFE TANKUT YAPAROĞLU

    Yüksek Lisans

    İngilizce

    İngilizce

    2004

    Elektrik ve Elektronik MühendisliğiDokuz Eylül Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. YAVUZ ŞENOL

  4. Classification of abnormal respiratory sounds using deep learning techniques

    Solunum seslerinin derin öğrenme yöntemleri ile sınıflandırılması

    AHAMADI ABDALLAH IDRISSE

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi Üniversitesi

    Bilgisayar Bilimleri Ana Bilim Dalı

    DOÇ. DR. OKTAY YILDIZ

  5. Classification of pediatric snoring episodes using deep convolutional neural networks

    Pediyatrik horlama episodlarının derin evrişimsel sinir ağları ile sınıflandırılması

    OZAN FIRAT CİVANER

    Yüksek Lisans

    İngilizce

    İngilizce

    2018

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. MUSTAFA ERSEL KAMAŞAK