Geri Dön

An improved transfer learning based siamese network for face recognation

Yüz tanıma için geliştirilmiş aktarım öğrenme tabanlı sıamese ağı

  1. Tez No: 898612
  2. Yazar: DALHM GHALIB HALBOOS AL-SHAMMARI
  3. Danışmanlar: البروفيسور. دكتور. DEVRİM AKGÜN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2024
  8. Dil: İngilizce
  9. Üniversite: Sakarya Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 77

Özet

Yüz tanıma, bir kişinin yüz özelliklerini analiz ederek kimlik doğrulaması veya tanımlama işlemi gerçekleştiren bir biyometrik teknoloji yöntemidir. Bu teknoloji, göz, burun, ağız ve çene gibi yüzün belirli bölgelerinin geometrik yapısını kullanarak bireylerin kimliklerini belirler. Yüz tanıma sistemleri, bir kamera aracılığıyla yüz görüntüsünü alır, bu görüntüden belirli noktaları veya bölgeleri tespit eder ve analiz eder. Çıkarılan yüz özellikleri, bir veri tabanında saklanan diğer yüz özellikleriyle karşılaştırılarak kişinin kimliği belirlenir veya doğrulanır. Yüz tanıma teknolojisi, güvenlik sistemleri, akıllı telefonlar, sosyal medya platformları ve kamu güvenliği gibi pek çok alanda yaygın olarak kullanılmaktadır. Günümüzde yüz tanıma (FR), bilgisayarlı görme, desen analizi, sinir ağları ve derin öğrenme gibi alanlarda karmaşık ve zorlu bir problem olarak kabul edilmektedir. Bilgisayarlı görme, bilgisayarların dijital görüntülerden veya videolardan anlamlı bilgiler çıkararak çevrelerini algılamalarını sağlayan bir disiplindir. Bu alanın önde gelen uygulamalarından biri de yüz tanımadır. Yüz tanıma, görüntü işleme tekniklerini kullanarak yüzlerin tespit edilmesi, yüz özelliklerinin çıkarılması ve bu bilgilerin analiz edilmesi süreçlerini kapsar. Desen analizi, verilerdeki belirli kalıpları veya yapıları tanıma ve sınıflandırma işlemidir ve yüz tanıma sistemlerinde kişinin yüzündeki benzersiz özellikler, yani gözler arasındaki mesafe, burnun şekli vb. üzerinden kimlik doğrulama yapılır. Bu konu, denetimli ve denetimsiz öğrenme gibi farklı yapay zeka topluluklarında sıkça tartışılmaktadır. Son yıllarda, derin öğrenmenin yükselişiyle birlikte yüz tanıma alanında önemli ilerlemeler kaydedilmiştir. Özellikle kısıtsız ortamlarda yüz tanıma, kafa pozisyonu, yaş, aydınlatma ve yüz ifadelerindeki farklılıklar gibi çeşitli zorluklara rağmen daha doğru ve uyarlanabilir modellerin geliştirilmesiyle mümkün hale gelmiştir. Bu nedenle, bu çalışma, yüksek doğruluk ve düşük yanlış alarmlara sahip, verimli ve uyarlanabilir bir FR sistemini geliştirmeyi amaçlamaktadır. Önerilen sistemde, etkili yüz tanıma ve bireylerin, özellikle de benzer yüz özelliklerine sahip bireylerin doğru şekilde tanınması için arka uç olarak Siyam sinir ağı SNN VGG-16'yı kullanılmıştır. VGG-16, büyük ve çeşitli bir veri kümesi olan ImageNet üzerinde önceden eğitilmiş bir evrişimli sinir ağı modelidir ve genellikle transfer öğrenimi için kullanılır. Transfer öğrenmede daha önce VGG-16'da öğrenilen özellik çıkarıcı katmanlar kullanılmakta ve bu katmanların üzerine yeni sınıflandırma katmanları eklenmektedir. Tipik olarak, VGG-16'nın evrişimli katmanları dondurulur (ağırlıkları değişmez) ve yeni eklenen sınıflandırma katmanları yalnızca belirli bir veri kümesi üzerinde eğitilir. Bu yaklaşım, daha az veri ve daha az eğitim süresiyle yüksek doğruluk elde edilmesini sağlar ve modelin yeni görevlere iyi bir şekilde genelleştirilmesine olanak tanır. SIAM sinir ağları, iki veya daha fazla veri örneği arasındaki benzerliği veya korelasyonu bulmak için kullanılan özel bir sinir ağı türüdür. Aynı ağırlıklara sahip iki paralel sinir ağından oluşur ve bu iki ağ, girdi çiftleri üzerinde çalışır ve her girdi için bir özellik vektörü elde edilir. Üretilen özellik vektörleri genellikle iki girdi arasındaki benzerliği ölçmek için Öklid mesafesi gibi bir benzerlik ölçüsü kullanılarak karşılaştırılır. İki girdi arasındaki benzerlik karar süreci için ikili çapraz entropi kullanılır. Bu yapı, girdilerin aynı dönüşüme uğramasını ve karşılaştırılmasını sağlar. Siam sinir ağları, özellikle yüz tanıma, imza doğrulama ve one-shot learning gibi benzerlik ölçümünün kritik olduğu alanlarda kullanılır. Örneğin, yüz tanıma uygulamalarında, iki yüz resminin aynı kişiye ait olup olmadığını belirlemek için kullanılır. Eğitim sürecinde, ağ, çeşitli yüz çiftleri (aynı kişiye ait veya farklı kişilere ait) üzerinde eğitilir ve her yüz resmi için bir özellik vektörü çıkarılır. İki yüz resmi karşılaştırılır ve aralarındaki mesafe hesaplanarak karar verilir. Bu ağların en büyük avantajı, aynı ağırlıkları paylaşan paralel ağlar sayesinde verimli öğrenme sağlamasıdır. Ayrıca, sınırlı veri ile etkili sonuçlar elde edilebilir, bu da özellikle tek seferde öğrenme (one-shot learning) ve birkaç adımda öğrenme (few-shot learning) senaryolarında önemlidir. Yeni ve görülmemiş örnekleri tanıma yeteneği yüksek olan Siam sinir ağları, benzerlik ölçümünün kritik olduğu birçok uygulama için güçlü ve esnek bir araçtır. Sunulan çalışmada yüz tanıma algoritmalarının gerçek dünya koşullarındaki performansını değerlendirmek için kritik bir kaynak olup, yüz tanıma alanındaki ilerlemeyi ölçmek için standart bir platform sağlayan LFW veri seti kullanılmıştır. LFW veri seti, yüz tanıma algoritmalarının performansını değerlendirmek için iki ana görev sağlar: yüz doğrulama, belirli iki yüz görüntüsünün aynı kişiye ait olup olmadığının belirlenmesi ve yüz tanıma bir yüz görüntüsünün kimliğinin belirlenmesi. Veri kümesi, etiketli yüz çiftlerini ve her yüzün ait olduğu kişinin kimliğini içeren meta verilerle birlikte gelir. Ayrıca veri seti“View 1”ve“View 2”olarak adlandırılan iki farklı değerlendirme protokolü içermektedir. Modeli eğitmek ve seçmek için“Görünüm 1”kullanılırken, son performansı değerlendirmek için“Görünüm 2”kullanılır. LFW veri seti yüz tanıma teknolojisinde önemli bir standart haline geldi. Araştırmacılar ve geliştiriciler bu veri setini algoritmalarının doğruluğunu ve sağlamlığını değerlendirmek için kullanıyor. VGG-16 tabanlı bir SNN modeli, LFW veri seti üzerinde eğitildiğinde, genellikle yüz tanıma görevlerinde düşük kayıp ve yüksek doğruluk oranları sergilemiştir. LFW veri seti, yüz tanıma algoritmalarının gerçek dünya koşullarındaki performansını değerlendirmek için kritik bir kaynak olarak kabul edilir. Farklı bireylere ait, çeşitli koşullarda çekilmiş 13,000'den fazla yüz görüntüsü içeren bu veri seti, yüz tanıma teknolojilerinin zorlu ve değişken senaryolarda nasıl işlediğini test etmek için standart bir platform sağlar. Bu sayede, yüz tanıma alanındaki ilerlemeyi nesnel bir şekilde ölçmek mümkün hale gelir. LFW veri kümesini SNN'ye giriş olarak kullanmak için ön işleme tabi tutulması gerekir. Ön işleme adımları görüntülerin yeniden boyutlandırılmasını içerir ve bu amaçla görüntüler 62 x 47 piksel boyutlarına yeniden boyutlandırılmıştır. Görüntülerin yeniden boyutlandırılması hesaplama karmaşıklığını azaltmak ve ağın yüzlerin temel özelliklerine odaklanmasını sağlar. LFW veri seti sınırlı sayıda örnek içerdiğinden, önerilen çalışma, veri seti görüntülerinin sayısını artırmak ve aşırı uyumu ortadan kaldırmak için LFW veri setini 5 sete bölerek Katmanlı K-Katlı çapraz doğrulama tekniği kullanmıştır. K-katlı çapraz doğrulama ile veri setinin farklı bölümlerini eğitim ve doğrulama için kullanarak, modelin farklı veri parçaları üzerinde nasıl performans gösterdiğini görmeyi sağlar. Böylece, modelin performansı hakkında daha güvenilir bir değerlendirme yapılabilir. Daha sonra önerilen yaklaşımın sağlam EfficientNet, ResNetB0 ve ConvNeXt algoritmaları olduğundan emin olmak için önerilen VGG-16'yı üç evrişimli ağla daha karşılaştırılmıştır. Sonuçlara göre EfficientNet, RestNet50 ve ConvNext sırasıyla %77.75, %95 ve %93.75 doğruluk değerleri üretmiştir. VGG-16 kullanılan SNN, düşük kayıp sergilemiş ve %96.25 ile yüz tanımada en iyi doğruluğu üretmiştir..

Özet (Çeviri)

In the digital era, interest in algorithms and theories for face recognition systems FR have been growing rapidly. Criminal identification, video surveillance, unmanned and autonomous vehicles, and building access control, are just examples of real applications that are gaining attraction among industries. FR is currently a highly difficult and complex subject in deep learning DL, neural networks, pattern analysis, and computer vision domains. Different learning groups, including controller environment and uncontrolled environment, have debated this issue. FR is a novel artificial intelligence application that DL has discovered recently. Earlier, many efforts have been dedicated to building accurate and adaptive FR models. However, recognizing faces in unconstrained environments poses a significant challenge due to various factors such as head pose, age, illumination, and facial expression variations, and others. Therefore , the aim of this study is to develop an efficient FR approach based on a Siamese neural network SNNs and Transfer Learning methods TL. The proposed approach employs SNNs with Visual Geometry Group 16 VGG-16 as a background for efficient FR especially in the case of individuals having similar facial features, and for the purpose of precisely identifying individuals in varying environments. The proposed approach consists of several phases, first data gathering, second data pre-processing, third model building, then comparing the proposed VGG-16 with three more convolutional networks (EfficientNet, ResNetB0, and ConvNeXt algorithms) to keep sure that the proposed approach is robust. For this purpose, labeled faces in the wild LFW dataset were used for SNN with VGG-16. After training the networks, the SNNs with VGG-16 exhibited low loss and a high accuracy in FR. Performance of the architectures were measured using K-Fold cross validation for 5 partition. According to results, EfficientNet, RestNet50 and ConvNext produced 77.75% accuracy, 95% and 93.75 % accuracy respectively.On the other hand, SNN with VGG-16 exhibited a low loss and produced the best accuracy in FR with 96.25%.

Benzer Tezler

  1. DA4HI: A deep learning framework for facial emotion recognition in affective systems for children with hearing impairments.

    DA4HI: İşitme engelli çocuklar için duyuşsal sistemlerde yüzdeki duyguların tanınması maksadıyla geliştirilen derin öğrenme modeli.

    CEMAL GÜRPINAR

    Doktora

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. HATİCE KÖSE

    PROF. DR. NAFİZ ARICA

  2. Empowering multimodal multimedia information retrieval through semantic deep learning

    Semantik derin öğrenme yoluyla multimodal multimedya bilgi erişimini güçlendirme

    SAEID SATTARI

    Doktora

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. MEHMET HALİT SEYFULLAH OĞUZTÜZÜN

    PROF. DR. ADNAN YAZICI

  3. Style-based generative adversarial networks for enhancing deep-learning-based person re-identification

    Derin öğrenme tabanlı kişi yeniden tanımlamak için stil tabanlı üretici çekişmeli (adversarıal) ağlar

    SALEH HUSSIN SALEM HUSSIN

    Doktora

    İngilizce

    İngilizce

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAnkara Yıldırım Beyazıt Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. REMZİ YILDIRIM

  4. Transfer learning based facial emotion recognition and action unit detection

    Transfer öğrenme tabanlı yüz ifadesinden duygu tanıma ve eylem birimi tespiti

    SÜLEYMAN ENGİN BAĞLAYİCİ

    Yüksek Lisans

    İngilizce

    İngilizce

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. HATİCE KÖSE

  5. Use of transfer learning for automatic dietary monitoring through throat microphone recordings

    Gırtlak mikrofonu kayıtları üzerinden öğrenim aktarımının otomatik diyet takibi için kullanımı

    MEHMET ALİ TUĞTEKİN TURAN

    Doktora

    İngilizce

    İngilizce

    2019

    Elektrik ve Elektronik MühendisliğiKoç Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ENGİN ERZİN