Domain adaptation for crowd counting
Kalabalık sayımı için etki alanı uyarlaması
- Tez No: 826670
- Danışmanlar: PROF. DR. HASARİ ÇELEBİ, DOÇ. DR. ERCHAN APTOULA
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2023
- Dil: İngilizce
- Üniversite: Gebze Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 68
Özet
Belirli bir alandaki veya sahnedeki insan sayısını tahmin etme görevi olan kalabalık sayımı, trafik yönetimi, kamu güvenliği ve etkinlik planlaması gibi çok sayıda pratik uygulamaya sahiptir. Geleneksel kalabalık sayma yöntemleri, zaman alıcı ve hatalara açık olan manuel ek açıklamalara dayanır. Kalabalık sayımı üzerine yapılan son çalışmalar, evrişimsel sinir ağı (CNN) mimarilerini kullanarak umut verici sonuçlar elde etmiştir. Ancak, gerçek dünyadaki kalabalık veri kümelerinde kamera bakış açıları, çözünürlükler ve kalabalık yoğunlukları gibi gerçek dünyadaki kalabalık veri kümelerinin farklı sahnelerindeki büyük varyasyonlar nedeniyle, standart CNN yöntemlerini kullanarak yüksek performans elde etmek zor olmaya devam etmektedir. Bu tür yöntemlerin en büyük sorunu genellikle performans düşüşleridir. Bu sorun alan uyarlaması olarak bilinir ve derin öğrenme ile kalabalık sayma alanında önemli ve aktif bir araştırma alanıdır. Bu zorluğun üstesinden gelmek için bu çalışma, üç yöntemi birleştiren yeni bir kalabalık sayma yaklaşımı önermektedir: Kalabalık sayma ağına rehberlik eden ve farklı veri kümelerinde normalleştirme parametrelerini üreten bir kılavuz ağı, kalabalık sayımında başarılı sonuçlar veren Ölçek Uyarlamalı Seçim Ağı ve yitim fonksiyonu olarak kullanıldığında Gauss Düzeltme tabanlı birçok yöntemden daha başarılı olduğu kanıtlanmış“Dağıtım Eşleştirme”yöntemi. Bu yaklaşım, eğitilen modelin farklı veri kümelerinde iyi performans göstermesini sağlamayı amaçlamaktadır. Birden fazla veri kümesi üzerinde kapsamlı deneyler yapılmış ve önerilen yaklaşımın son teknoloji yöntemlerle performans karşılaştırması sunulmuştur. Ayrıca, literatürdeki GAN tabanlı son teknoloji görüntüden görüntüye çeviri yöntemlerinin kalabalık sayımında alan uyarlaması için kullanımına ilişkin deneysel çalışmalar ve karşılaştırmalı sonuçlar sunulmuştur.
Özet (Çeviri)
Crowd counting, the task of estimating the number of people in a specific area or scene, has numerous practical applications such as traffic management, public safety, and event planning. Traditional crowd-counting methods rely on manual annotations, which are time-consuming and prone to errors. Recent studies on crowd counting have achieved promising results using Convolutional Neural Network (CNN) architectures. However, due to significant variations in real-world crowd datasets, such as camera angles, resolutions, and crowd densities across different scenes, achieving high performance using standard CNN methods remains challenging. A common issue with such methods is often performance degradation. This problem is known as domain adaptation, and it is an important and active research area in the field of crowd counting with deep learning. To address this challenge, this study proposes a new crowd-counting approach that combines three methods: a guiding network that guides the crowd-counting network and produces normalization parameters across different datasets, the Scale-Adaptive Selection Network which has shown successful results in crowd counting, and the“Distribution Matching”method, which has been proven to be more effective than many Gauss Correction-based methods when used as a loss function. This approach aims to ensure that the trained model performs well across different datasets. Comprehensive experiments on multiple datasets have been conducted, and a performance comparison of the proposed approach against state-of-the-art methods is presented. In addition, experimental studies and comparative results on the use of GAN-based state-of-the-art image-to-image translation methods in the literature for domain adaptation in crowd counting are presented.
Benzer Tezler
- Domain adaptation for speech-driven affective facial features synthesis
Başlık çevirisi yok
RIZWAN SADIQ
Doktora
İngilizce
2020
Elektrik ve Elektronik MühendisliğiKoç ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
Prof. Dr. ENGİN ERZİN
- Deep Domain adaptation for the semantic segmentation of remote sensing images
Uzaktan algılama görüntülerinin sezgisel bölümlemesi için derin alan uyarlaması
SARMAD FAKHRULDDIN ISMAEL ISMAEL
Doktora
İngilizce
2023
Elektrik ve Elektronik MühendisliğiGebze Teknik ÜniversitesiElektronik Mühendisliği Ana Bilim Dalı
PROF. DR. KORAY KAYABOL
DOÇ. DR. ERCHAN APTOULA
- İngilizce'den Türkçe'ye istatistiksel bilgisayarlı çeviri sistemlerinde alan uyarlaması ile başarının artırılması
Evaluation of domain adaptation approaches on English-to-Turkish statistical machine translation systems
EZGİ YILDIRIM
Yüksek Lisans
Türkçe
2014
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. AHMET CÜNEYD TANTUĞ
- On improving cross-domain performance of semantic segmentation in the case of limited data
Sınırlı veri durumunda anlamsal bölütlemenin alanlar arasıperformansının iyileştirilmesi
ALİ SOLAK
Yüksek Lisans
İngilizce
2023
Elektrik ve Elektronik MühendisliğiEskişehir Teknik ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
DOÇ. DR. CİHAN TOPAL
- Domain adaptation on graphs by learning aligned graph bases
Hizalanmış graf tabanları öğrenerek graflar üzerinde alan uyarlama
MEHMET PİLANCI
Yüksek Lisans
İngilizce
2018
Elektrik ve Elektronik MühendisliğiOrta Doğu Teknik ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ELİF VURAL