Style-based generative adversarial networks for enhancing deep-learning-based person re-identification

Derin öğrenme tabanlı kişi yeniden tanımlamak için stil tabanlı üretici çekişmeli (adversarıal) ağlar

PDF İndir

Tez No: 714907
Yazar: SALEH HUSSIN SALEM HUSSIN
Danışmanlar: PROF. DR. REMZİ YILDIRIM
Tez Türü: Doktora
Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
Anahtar Kelimeler: Kişinin yeniden tanımlanması, Derin öğrenme, Transfer öğrenimi, Evrişimli sinir ağları, Üretken düşmanlık ağları, Aykırı değerler için etiket yumuşatma düzenlemesi, StyleGAN, Person re-identification, Deep learning, Transfer learning, Convolutional neural networks, Generative adversarial networks, Label smoothing regularization for outliers, StyleGAN
Yıl: 2021
Dil: İngilizce
Üniversite: Ankara Yıldırım Beyazıt Üniversitesi
Enstitü: Fen Bilimleri Enstitüsü
Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
Bilim Dalı: Belirtilmemiş.
Sayfa Sayısı: 195

Özet

Derin öğrenme teknolojisi, kişiyi yeniden tanımlama performansını büyük ölçüde artırdı. Öğrenmedeki zorlukların etkisini bir dereceye kadar azaltmaya da katkıda bulundu. Ancak, bu derin öğrenme yöntemlerin eğitimi için büyük miktarda lisanslı veriye ihtiyaç duyulduğu için yeni bir zorluk ile de karşılaşıldı. Dolayısıyla, kişinin yeniden tanımlanması hala ciddi bir sorundur ve tüm değişik zorluklar için de belirgin bir çözümü de yoktur. Bu nedenle, eğitim setleri için yeterli veri seti ile derin öğrenme teknolojisini kullanan bir kişiyi yeniden tanımlama yönteminin geliştirilmesine ihtiyaç vardır. Bu çalışmada, derin öğrenme teknolojisine dayalı kişi yeniden tanımlama yöntemi ile birlikte StyleGAN ve LSRO algoritması önermektedir. Önerilen yöntem, derin öğrenmeye dayalı kişinin yeniden tanımlanmasına ilişkin temel sorunu, yani eğitim için gerekli veri eksikliğini çözmektedir. Nesne tanıma için geliştirilen genel CNN modelini değiştirerek kişiyi yeniden tanımlamaya yönelik güçlü ayırt edici özellikler elde etmek için başarılı bir temel model oluşturarak işe başlar. Daha sonra, mevcut kişi yeniden tanımlama veri kümelerinden yüksek kaliteli yeni sentetik görüntüler oluşturmak için StyleGAN'ı kullanır. Oluşturulan bu görüntüler, arka plan, renk, aydınlatma ve pozlar açısından çok daha kapsamlı bir çeşitlilik sunarak eğitim setlerini genişletmek için kullanır. Sonrada, LSRO algoritması, StyleGAN tarafından üretilen görüntüleri, tek tip bir etiket dağılımı yaparak ve temel modeli eğitmek için düzenli bir kayıp işlevi tanımlayarak orijinal etiketli eğitim görüntülerine entegre etmek için kullanılır. StyleGAN kullanılarak yeni yüksek kaliteli sentetik görüntülerin oluşturulması ve bunların LSRO kullanılarak veri kümelerindeki gerçek görüntülerle entegre edilmesi, bu çalışmanın bu alana yaptığı en önemli katkısıdır. Gerçekleştirilen deneysel analiz ve sonuçları, önerilen kişiyi yeniden tanımlama yaklaşımımız, diğer teknoloji metotlara göre daha iyi performans elde edilmiştir. .

Özet (Çeviri)

Deep-learning (DL) technologies have greatly boosted the performance of person Re-ID. However, they add a new challenge, in that these deep methods need large amounts of labeled data for training. Hence, person Re-ID remains an open problem, for which no prominent solutions have been found for all the different challenges. Thus, there is a need to develop a person Re-ID method that uses DL technology with a sufficient dataset for training. This study proposes an improved person Re-ID method based on DL technology, along with a StyleGAN and LSRO algorithm. The proposed method can solve the main issue of DL-based person Re-ID, namely the lack of data needed for training. It begins by constructing a successful baseline model to extract the strong discriminative features necessary for person Re-ID by modifying a general CNN model developed for the general object recognition task. Then, fine-tuning it using the transfer learning approach to make it more suitable for the person Re-ID problem domain. Moreover, random erasing and re-ranking are combined with the baseline model proposed herein to achieve significant performance improvement further and avoid overfitting. Afterward, the proposed method for person Re-ID exploits the StyleGAN to generate synthetic images that are both new and high-quality using the person Re-ID datasets that already exist. These newly generated images are then used to enlarge the training sets by introducing more extensive variations in terms of illumination, background, poses, and color. Then, the LSRO algorithm is used to integrate the generated images into the originally labeled training images. This is done by giving each of them uniform label distribution and designating a regularized loss function to them for the training of the baseline model. Generation of the new high-quality synthetic images using the StyleGAN and integrating them with the real images in datasets using the LSRO is the foremost contribution of the present research. The conducted experimental analysis and results proved that the proposed person Re-ID approach yielded better overall performance when compared with state-of-the-art person Re-ID approaches.

Benzer Tezler

Tez No
612760
Style synthesizing conditional generative adversarial networks
Stil sentezleyici koşullu çekişmeli üretici ağlar
YARKIN DENİZ ÇETİN
Yüksek Lisans
İngilizce
2020
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol İhsan Doğramacı Bilkent Üniversitesi
Bilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. SELİM AKSOY
DR. ÖĞR. ÜYESİ RAMAZAN GÖKBERK CİNBİŞ
Tez No
958831
Architectural section generation and semantic evaluation with deep learning methods
Derin öğrenme yöntemleri ile mimari kesit üretimi ve anlamsal değerlendirilmesi
ECE SAVAŞ
Yüksek Lisans
İngilizce
2025
Mimarlık İstanbul Teknik Üniversitesi
Bilişim Ana Bilim Dalı
PROF. DR. MİNE ÖZKAR KABAKÇIOĞLU
Tez No
807122
Terrain classification by using hyperspectral and LiDAR data
Hiperspektral ve LiDAR verisi ile arazi sınıflandırması
ALİ GÖKALP PEKER
Doktora
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol Orta Doğu Teknik Üniversitesi
Bilişim Sistemleri Ana Bilim Dalı
PROF. DR. YASEMİN YARDIMCI ÇETİN
DR. ÖĞR. ÜYESİ RAMAZAN GÖKBERK CİNBİŞ
Tez No
866045
Image inpainting with diffusion models and generative adversarial networks
Difüzyon modelleri ve çekişmeli üretici ağları ile görüntü tamamlama
AHMET BURAK YILDIRIM
Yüksek Lisans
İngilizce
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol İhsan Doğramacı Bilkent Üniversitesi
Bilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ AYŞEGÜL DÜNDAR BORAL
Tez No
633721
Words as art materials: Generating paintings with sequential generative adversarial networks
Sanat materyali olarak kelimeler: Seri üretici çekişmeli ağlar ̇ile sanatsal resim üretimi
AZMİ CAN ÖZGEN
Yüksek Lisans
İngilizce
2020
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol İstanbul Teknik Üniversitesi
Bilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. HAZIM KEMAL EKENEL

Geri Dön