Rescoring detections based on contextual scores in object detection
Nesne algılama yöntemlerinden elde edilen sezimlerin skorlarının bağlam bilgisi kullanılarak yeniden hesaplanması
- Tez No: 560498
- Danışmanlar: DR. ÖĞR. ÜYESİ EMRE AKBAŞ
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2019
- Dil: İngilizce
- Üniversite: Orta Doğu Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 78
Özet
Modern nesne algılama yöntemleri, problemi çözmek için öncelikle verilen bir görüntüde aday nesne bölgeleri belirler, daha sonra bu aday bölgelerin görsel özniteliklerini kullanarak sınıflarını kestirmeye çalışır. Bu yöntemler, sadece aday nesne bölgelerinden elde edilen görsel öznitelikler üzerinde çalıştıklarından, resimdeki bağlam bilgisini gözardı etmektedirler. Nesne tanıma başarımını artırmak amacıyla bölgesel özniteliklere ek olarak resimlerdeki bağlam bilgisinden faydalanılabilir. Bu amaçla geliştirilen yöntemler, görüntü seviyesinde ve/veya nesne seviyesinde bağlam bilgisini aynı görüntüdeki alakalı başka bölgelerin görsel özniteliklerini de hesaplamaya katarak değerlendirmiş olurlar. Bu çalışmada, nesne tanıma başarımını artırmak amacıyla, aynı görüntüde tespit edilen diğer nesnelerin güven puanlarını bağlam bilgisi olarak kullanan yöntemler önerilmektedir. Bu çalışmada önerilen yöntemler, herhangi bir nesne algılama yönteminin sonuçları üzerinde uygulanabilir ve nesnelerin arasındaki konumsal ve ölçeğe dayalı ilişkileri kullanır. Açıklamak gerekirse, nesne algılama yöntemi tarafından tespit edilen her nesne için, o nesneye göreceli olacak şekilde çeşitli konumsal ve ölçeğe dayalı bölgeler belirlenir. Bu bölgelerin özet bilgisi, bölgenin içerisine düşen nesnelerin güven puanları kullanılarak çıkartılır. Referans nesnenin güven puanları ve tanımlanan bölgelerin özetleri işlenerek referans nesne için yeni güven puanları hesaplanır. Performans artırımını sağlayabilmek amacıyla bu çalışmada çok katmanlı algılayıcı tabanlı üç model önerilmektedir. Bu modeller RetinaNet modelinin sonuçları kullanılarak MSCOCO veri kümesi üzerinde değerlendirilmiş ve ortalama hassasiyet değerinin temel alınan RetinaNet modeline göre %1.8'e kadar artırıldığı gözlenmiştir.
Özet (Çeviri)
To detect objects in an image, current state-of-the-art object detectors firstly define candidate object locations, and then classify each of them into one of the predefined categories or as background. They do so by using the visual features extracted locally from the candidate locations; omitting the rich contextual information embedded in the whole image. Contextual information can be utilized to complement the information extracted locally and thereby to improve object detection accuracy. Researchers have proposed many models that exploit scene-level and/or instance-level context by using non-local features from the same image. In this work, we propose models to improve object detection by utilizing contextual information embedded in the confidence scores of detections in the whole image without using any visual features. Our models use object-to-object spatial and scale-related relationships and work as a post-processing step that can be plugged into any object detector. Specifically, for a reference detection output by the base object detector, our model first defines a variety of spatial and scale-based regions relative to the location of the reference detection. Then, each of these regions is summarized by the confidence scores of detections inside it. Next, the confidence scores of the reference detection and the contextual confidence scores are processed by our models. We propose three variants based on multilayer perceptrons. We evaluate our models in conjunction with the state-of-the-art RetinaNet object detector on the widely used MSCOCO benchmark dataset, where we show that our models improve average precision by up to %1.8 points.
Benzer Tezler
- Cyber tools as foreign policy instruments in trilateral relations: Analysing cyber-attacks targeting the United Kingdom
Üçlü ilişkilerde dış politika aracı olarak siber araçlar: Birleşik Krallık'ı hedef alan siber saldırıların analizi
ATAKAN YILMAZ
Doktora
İngilizce
2024
Siyasal BilimlerGalatasaray ÜniversitesiUluslararası İlişkiler Ana Bilim Dalı
DOÇ. DR. MENENT SAVAŞ CAZALA
- Digital video stabilization with SIFT flow
SIFT akışı ile sayısal video sabitleme
İNCİ MELİHA BAYTAŞ
Yüksek Lisans
İngilizce
2014
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
PROF. DR. MELİH PAZARCI
- Sağlık hizmetlerine erişim: Kadınların meme ve rahim kanseri tarama hizmetlerine erişimine yönelik bir nitel çalışma
Access to health services: A qualitative study on women's access to breast and cervical cancer screening services
ŞAFAK KIRAN
Doktora
Türkçe
2023
Sağlık Kurumları YönetimiSakarya ÜniversitesiSağlık Yönetimi Ana Bilim Dalı
PROF. DR. MAHMUT AKBOLAT
- Design of a microprocessor-based embedded fault diagnostic system and an FPGA-based improvement proposal
Mikroişlemci tabanlı bir gömülü tanı sistemi tasarımı ve FPGA tabanlı bir optimizasyon önerisi
ONUR BEKAR
Yüksek Lisans
İngilizce
2022
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
PROF. DR. ECE OLCAY GÜNEŞ
- 7. sınıf sosyal bilgiler dersi Türk tarihinde yolculuk ünitesinde geçen bazı kavramların öğrenilmesi sürecinde karşılaşılan sorunların belirlenmesi ve çözümüne yönelik bir eylem araştırması
An action research intended to solve and detect the encountered issues that are used during the process of studying of some concepts on the 7th grade social studies corse in the unit 'voyage in the history of Turkish
İBRAHİM AKŞİT