Style-based generative adversarial networks for enhancing deep-learning-based person re-identification
Derin öğrenme tabanlı kişi yeniden tanımlamak için stil tabanlı üretici çekişmeli (adversarıal) ağlar
- Tez No: 714907
- Danışmanlar: PROF. DR. REMZİ YILDIRIM
- Tez Türü: Doktora
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Kişinin yeniden tanımlanması, Derin öğrenme, Transfer öğrenimi, Evrişimli sinir ağları, Üretken düşmanlık ağları, Aykırı değerler için etiket yumuşatma düzenlemesi, StyleGAN, Person re-identification, Deep learning, Transfer learning, Convolutional neural networks, Generative adversarial networks, Label smoothing regularization for outliers, StyleGAN
- Yıl: 2021
- Dil: İngilizce
- Üniversite: Ankara Yıldırım Beyazıt Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 195
Özet
Derin öğrenme teknolojisi, kişiyi yeniden tanımlama performansını büyük ölçüde artırdı. Öğrenmedeki zorlukların etkisini bir dereceye kadar azaltmaya da katkıda bulundu. Ancak, bu derin öğrenme yöntemlerin eğitimi için büyük miktarda lisanslı veriye ihtiyaç duyulduğu için yeni bir zorluk ile de karşılaşıldı. Dolayısıyla, kişinin yeniden tanımlanması hala ciddi bir sorundur ve tüm değişik zorluklar için de belirgin bir çözümü de yoktur. Bu nedenle, eğitim setleri için yeterli veri seti ile derin öğrenme teknolojisini kullanan bir kişiyi yeniden tanımlama yönteminin geliştirilmesine ihtiyaç vardır. Bu çalışmada, derin öğrenme teknolojisine dayalı kişi yeniden tanımlama yöntemi ile birlikte StyleGAN ve LSRO algoritması önermektedir. Önerilen yöntem, derin öğrenmeye dayalı kişinin yeniden tanımlanmasına ilişkin temel sorunu, yani eğitim için gerekli veri eksikliğini çözmektedir. Nesne tanıma için geliştirilen genel CNN modelini değiştirerek kişiyi yeniden tanımlamaya yönelik güçlü ayırt edici özellikler elde etmek için başarılı bir temel model oluşturarak işe başlar. Daha sonra, mevcut kişi yeniden tanımlama veri kümelerinden yüksek kaliteli yeni sentetik görüntüler oluşturmak için StyleGAN'ı kullanır. Oluşturulan bu görüntüler, arka plan, renk, aydınlatma ve pozlar açısından çok daha kapsamlı bir çeşitlilik sunarak eğitim setlerini genişletmek için kullanır. Sonrada, LSRO algoritması, StyleGAN tarafından üretilen görüntüleri, tek tip bir etiket dağılımı yaparak ve temel modeli eğitmek için düzenli bir kayıp işlevi tanımlayarak orijinal etiketli eğitim görüntülerine entegre etmek için kullanılır. StyleGAN kullanılarak yeni yüksek kaliteli sentetik görüntülerin oluşturulması ve bunların LSRO kullanılarak veri kümelerindeki gerçek görüntülerle entegre edilmesi, bu çalışmanın bu alana yaptığı en önemli katkısıdır. Gerçekleştirilen deneysel analiz ve sonuçları, önerilen kişiyi yeniden tanımlama yaklaşımımız, diğer teknoloji metotlara göre daha iyi performans elde edilmiştir. .
Özet (Çeviri)
Deep-learning (DL) technologies have greatly boosted the performance of person Re-ID. However, they add a new challenge, in that these deep methods need large amounts of labeled data for training. Hence, person Re-ID remains an open problem, for which no prominent solutions have been found for all the different challenges. Thus, there is a need to develop a person Re-ID method that uses DL technology with a sufficient dataset for training. This study proposes an improved person Re-ID method based on DL technology, along with a StyleGAN and LSRO algorithm. The proposed method can solve the main issue of DL-based person Re-ID, namely the lack of data needed for training. It begins by constructing a successful baseline model to extract the strong discriminative features necessary for person Re-ID by modifying a general CNN model developed for the general object recognition task. Then, fine-tuning it using the transfer learning approach to make it more suitable for the person Re-ID problem domain. Moreover, random erasing and re-ranking are combined with the baseline model proposed herein to achieve significant performance improvement further and avoid overfitting. Afterward, the proposed method for person Re-ID exploits the StyleGAN to generate synthetic images that are both new and high-quality using the person Re-ID datasets that already exist. These newly generated images are then used to enlarge the training sets by introducing more extensive variations in terms of illumination, background, poses, and color. Then, the LSRO algorithm is used to integrate the generated images into the originally labeled training images. This is done by giving each of them uniform label distribution and designating a regularized loss function to them for the training of the baseline model. Generation of the new high-quality synthetic images using the StyleGAN and integrating them with the real images in datasets using the LSRO is the foremost contribution of the present research. The conducted experimental analysis and results proved that the proposed person Re-ID approach yielded better overall performance when compared with state-of-the-art person Re-ID approaches.
Benzer Tezler
- Style synthesizing conditional generative adversarial networks
Stil sentezleyici koşullu çekişmeli üretici ağlar
YARKIN DENİZ ÇETİN
Yüksek Lisans
İngilizce
2020
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİhsan Doğramacı Bilkent ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. SELİM AKSOY
DR. ÖĞR. ÜYESİ RAMAZAN GÖKBERK CİNBİŞ
- Terrain classification by using hyperspectral and LiDAR data
Hiperspektral ve LiDAR verisi ile arazi sınıflandırması
ALİ GÖKALP PEKER
Doktora
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik ÜniversitesiBilişim Sistemleri Ana Bilim Dalı
PROF. DR. YASEMİN YARDIMCI ÇETİN
DR. ÖĞR. ÜYESİ RAMAZAN GÖKBERK CİNBİŞ
- Image inpainting with diffusion models and generative adversarial networks
Difüzyon modelleri ve çekişmeli üretici ağları ile görüntü tamamlama
AHMET BURAK YILDIRIM
Yüksek Lisans
İngilizce
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİhsan Doğramacı Bilkent ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ AYŞEGÜL DÜNDAR BORAL
- Words as art materials: Generating paintings with sequential generative adversarial networks
Sanat materyali olarak kelimeler: Seri üretici çekişmeli ağlar ̇ile sanatsal resim üretimi
AZMİ CAN ÖZGEN
Yüksek Lisans
İngilizce
2020
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. HAZIM KEMAL EKENEL
- Domain-adaptive self-supervised pre-training for face & body detection in drawings
Başlık çevirisi yok
BARIŞ BATUHAN TOPAL
Yüksek Lisans
İngilizce
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKoç ÜniversitesiBilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı
DOÇ. DR. TEVFİK METİN SEZGİN