Geri Dön

Style-based generative adversarial networks for enhancing deep-learning-based person re-identification

Derin öğrenme tabanlı kişi yeniden tanımlamak için stil tabanlı üretici çekişmeli (adversarıal) ağlar

  1. Tez No: 714907
  2. Yazar: SALEH HUSSIN SALEM HUSSIN
  3. Danışmanlar: PROF. DR. REMZİ YILDIRIM
  4. Tez Türü: Doktora
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Kişinin yeniden tanımlanması, Derin öğrenme, Transfer öğrenimi, Evrişimli sinir ağları, Üretken düşmanlık ağları, Aykırı değerler için etiket yumuşatma düzenlemesi, StyleGAN, Person re-identification, Deep learning, Transfer learning, Convolutional neural networks, Generative adversarial networks, Label smoothing regularization for outliers, StyleGAN
  7. Yıl: 2021
  8. Dil: İngilizce
  9. Üniversite: Ankara Yıldırım Beyazıt Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 195

Özet

Derin öğrenme teknolojisi, kişiyi yeniden tanımlama performansını büyük ölçüde artırdı. Öğrenmedeki zorlukların etkisini bir dereceye kadar azaltmaya da katkıda bulundu. Ancak, bu derin öğrenme yöntemlerin eğitimi için büyük miktarda lisanslı veriye ihtiyaç duyulduğu için yeni bir zorluk ile de karşılaşıldı. Dolayısıyla, kişinin yeniden tanımlanması hala ciddi bir sorundur ve tüm değişik zorluklar için de belirgin bir çözümü de yoktur. Bu nedenle, eğitim setleri için yeterli veri seti ile derin öğrenme teknolojisini kullanan bir kişiyi yeniden tanımlama yönteminin geliştirilmesine ihtiyaç vardır. Bu çalışmada, derin öğrenme teknolojisine dayalı kişi yeniden tanımlama yöntemi ile birlikte StyleGAN ve LSRO algoritması önermektedir. Önerilen yöntem, derin öğrenmeye dayalı kişinin yeniden tanımlanmasına ilişkin temel sorunu, yani eğitim için gerekli veri eksikliğini çözmektedir. Nesne tanıma için geliştirilen genel CNN modelini değiştirerek kişiyi yeniden tanımlamaya yönelik güçlü ayırt edici özellikler elde etmek için başarılı bir temel model oluşturarak işe başlar. Daha sonra, mevcut kişi yeniden tanımlama veri kümelerinden yüksek kaliteli yeni sentetik görüntüler oluşturmak için StyleGAN'ı kullanır. Oluşturulan bu görüntüler, arka plan, renk, aydınlatma ve pozlar açısından çok daha kapsamlı bir çeşitlilik sunarak eğitim setlerini genişletmek için kullanır. Sonrada, LSRO algoritması, StyleGAN tarafından üretilen görüntüleri, tek tip bir etiket dağılımı yaparak ve temel modeli eğitmek için düzenli bir kayıp işlevi tanımlayarak orijinal etiketli eğitim görüntülerine entegre etmek için kullanılır. StyleGAN kullanılarak yeni yüksek kaliteli sentetik görüntülerin oluşturulması ve bunların LSRO kullanılarak veri kümelerindeki gerçek görüntülerle entegre edilmesi, bu çalışmanın bu alana yaptığı en önemli katkısıdır. Gerçekleştirilen deneysel analiz ve sonuçları, önerilen kişiyi yeniden tanımlama yaklaşımımız, diğer teknoloji metotlara göre daha iyi performans elde edilmiştir. .

Özet (Çeviri)

Deep-learning (DL) technologies have greatly boosted the performance of person Re-ID. However, they add a new challenge, in that these deep methods need large amounts of labeled data for training. Hence, person Re-ID remains an open problem, for which no prominent solutions have been found for all the different challenges. Thus, there is a need to develop a person Re-ID method that uses DL technology with a sufficient dataset for training. This study proposes an improved person Re-ID method based on DL technology, along with a StyleGAN and LSRO algorithm. The proposed method can solve the main issue of DL-based person Re-ID, namely the lack of data needed for training. It begins by constructing a successful baseline model to extract the strong discriminative features necessary for person Re-ID by modifying a general CNN model developed for the general object recognition task. Then, fine-tuning it using the transfer learning approach to make it more suitable for the person Re-ID problem domain. Moreover, random erasing and re-ranking are combined with the baseline model proposed herein to achieve significant performance improvement further and avoid overfitting. Afterward, the proposed method for person Re-ID exploits the StyleGAN to generate synthetic images that are both new and high-quality using the person Re-ID datasets that already exist. These newly generated images are then used to enlarge the training sets by introducing more extensive variations in terms of illumination, background, poses, and color. Then, the LSRO algorithm is used to integrate the generated images into the originally labeled training images. This is done by giving each of them uniform label distribution and designating a regularized loss function to them for the training of the baseline model. Generation of the new high-quality synthetic images using the StyleGAN and integrating them with the real images in datasets using the LSRO is the foremost contribution of the present research. The conducted experimental analysis and results proved that the proposed person Re-ID approach yielded better overall performance when compared with state-of-the-art person Re-ID approaches.

Benzer Tezler

  1. Style synthesizing conditional generative adversarial networks

    Stil sentezleyici koşullu çekişmeli üretici ağlar

    YARKIN DENİZ ÇETİN

    Yüksek Lisans

    İngilizce

    İngilizce

    2020

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİhsan Doğramacı Bilkent Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. SELİM AKSOY

    DR. ÖĞR. ÜYESİ RAMAZAN GÖKBERK CİNBİŞ

  2. Terrain classification by using hyperspectral and LiDAR data

    Hiperspektral ve LiDAR verisi ile arazi sınıflandırması

    ALİ GÖKALP PEKER

    Doktora

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik Üniversitesi

    Bilişim Sistemleri Ana Bilim Dalı

    PROF. DR. YASEMİN YARDIMCI ÇETİN

    DR. ÖĞR. ÜYESİ RAMAZAN GÖKBERK CİNBİŞ

  3. Image inpainting with diffusion models and generative adversarial networks

    Difüzyon modelleri ve çekişmeli üretici ağları ile görüntü tamamlama

    AHMET BURAK YILDIRIM

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİhsan Doğramacı Bilkent Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ AYŞEGÜL DÜNDAR BORAL

  4. Words as art materials: Generating paintings with sequential generative adversarial networks

    Sanat materyali olarak kelimeler: Seri üretici çekişmeli ağlar ̇ile sanatsal resim üretimi

    AZMİ CAN ÖZGEN

    Yüksek Lisans

    İngilizce

    İngilizce

    2020

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. HAZIM KEMAL EKENEL

  5. Domain-adaptive self-supervised pre-training for face & body detection in drawings

    Başlık çevirisi yok

    BARIŞ BATUHAN TOPAL

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKoç Üniversitesi

    Bilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı

    DOÇ. DR. TEVFİK METİN SEZGİN