Geri Dön

Rescoring detections based on contextual scores in object detection

Nesne algılama yöntemlerinden elde edilen sezimlerin skorlarının bağlam bilgisi kullanılarak yeniden hesaplanması

  1. Tez No: 560498
  2. Yazar: ERSAN VURAL ZORLU
  3. Danışmanlar: DR. ÖĞR. ÜYESİ EMRE AKBAŞ
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2019
  8. Dil: İngilizce
  9. Üniversite: Orta Doğu Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 78

Özet

Modern nesne algılama yöntemleri, problemi çözmek için öncelikle verilen bir görüntüde aday nesne bölgeleri belirler, daha sonra bu aday bölgelerin görsel özniteliklerini kullanarak sınıflarını kestirmeye çalışır. Bu yöntemler, sadece aday nesne bölgelerinden elde edilen görsel öznitelikler üzerinde çalıştıklarından, resimdeki bağlam bilgisini gözardı etmektedirler. Nesne tanıma başarımını artırmak amacıyla bölgesel özniteliklere ek olarak resimlerdeki bağlam bilgisinden faydalanılabilir. Bu amaçla geliştirilen yöntemler, görüntü seviyesinde ve/veya nesne seviyesinde bağlam bilgisini aynı görüntüdeki alakalı başka bölgelerin görsel özniteliklerini de hesaplamaya katarak değerlendirmiş olurlar. Bu çalışmada, nesne tanıma başarımını artırmak amacıyla, aynı görüntüde tespit edilen diğer nesnelerin güven puanlarını bağlam bilgisi olarak kullanan yöntemler önerilmektedir. Bu çalışmada önerilen yöntemler, herhangi bir nesne algılama yönteminin sonuçları üzerinde uygulanabilir ve nesnelerin arasındaki konumsal ve ölçeğe dayalı ilişkileri kullanır. Açıklamak gerekirse, nesne algılama yöntemi tarafından tespit edilen her nesne için, o nesneye göreceli olacak şekilde çeşitli konumsal ve ölçeğe dayalı bölgeler belirlenir. Bu bölgelerin özet bilgisi, bölgenin içerisine düşen nesnelerin güven puanları kullanılarak çıkartılır. Referans nesnenin güven puanları ve tanımlanan bölgelerin özetleri işlenerek referans nesne için yeni güven puanları hesaplanır. Performans artırımını sağlayabilmek amacıyla bu çalışmada çok katmanlı algılayıcı tabanlı üç model önerilmektedir. Bu modeller RetinaNet modelinin sonuçları kullanılarak MSCOCO veri kümesi üzerinde değerlendirilmiş ve ortalama hassasiyet değerinin temel alınan RetinaNet modeline göre %1.8'e kadar artırıldığı gözlenmiştir.

Özet (Çeviri)

To detect objects in an image, current state-of-the-art object detectors firstly define candidate object locations, and then classify each of them into one of the predefined categories or as background. They do so by using the visual features extracted locally from the candidate locations; omitting the rich contextual information embedded in the whole image. Contextual information can be utilized to complement the information extracted locally and thereby to improve object detection accuracy. Researchers have proposed many models that exploit scene-level and/or instance-level context by using non-local features from the same image. In this work, we propose models to improve object detection by utilizing contextual information embedded in the confidence scores of detections in the whole image without using any visual features. Our models use object-to-object spatial and scale-related relationships and work as a post-processing step that can be plugged into any object detector. Specifically, for a reference detection output by the base object detector, our model first defines a variety of spatial and scale-based regions relative to the location of the reference detection. Then, each of these regions is summarized by the confidence scores of detections inside it. Next, the confidence scores of the reference detection and the contextual confidence scores are processed by our models. We propose three variants based on multilayer perceptrons. We evaluate our models in conjunction with the state-of-the-art RetinaNet object detector on the widely used MSCOCO benchmark dataset, where we show that our models improve average precision by up to %1.8 points.

Benzer Tezler

  1. Cyber tools as foreign policy instruments in trilateral relations: Analysing cyber-attacks targeting the United Kingdom

    Üçlü ilişkilerde dış politika aracı olarak siber araçlar: Birleşik Krallık'ı hedef alan siber saldırıların analizi

    ATAKAN YILMAZ

    Doktora

    İngilizce

    İngilizce

    2024

    Siyasal BilimlerGalatasaray Üniversitesi

    Uluslararası İlişkiler Ana Bilim Dalı

    DOÇ. DR. MENENT SAVAŞ CAZALA

  2. Digital video stabilization with SIFT flow

    SIFT akışı ile sayısal video sabitleme

    İNCİ MELİHA BAYTAŞ

    Yüksek Lisans

    İngilizce

    İngilizce

    2014

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    PROF. DR. MELİH PAZARCI

  3. Sağlık hizmetlerine erişim: Kadınların meme ve rahim kanseri tarama hizmetlerine erişimine yönelik bir nitel çalışma

    Access to health services: A qualitative study on women's access to breast and cervical cancer screening services

    ŞAFAK KIRAN

    Doktora

    Türkçe

    Türkçe

    2023

    Sağlık Kurumları YönetimiSakarya Üniversitesi

    Sağlık Yönetimi Ana Bilim Dalı

    PROF. DR. MAHMUT AKBOLAT

  4. Design of a microprocessor-based embedded fault diagnostic system and an FPGA-based improvement proposal

    Mikroişlemci tabanlı bir gömülü tanı sistemi tasarımı ve FPGA tabanlı bir optimizasyon önerisi

    ONUR BEKAR

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    PROF. DR. ECE OLCAY GÜNEŞ

  5. 7. sınıf sosyal bilgiler dersi Türk tarihinde yolculuk ünitesinde geçen bazı kavramların öğrenilmesi sürecinde karşılaşılan sorunların belirlenmesi ve çözümüne yönelik bir eylem araştırması

    An action research intended to solve and detect the encountered issues that are used during the process of studying of some concepts on the 7th grade social studies corse in the unit 'voyage in the history of Turkish

    İBRAHİM AKŞİT

    Doktora

    Türkçe

    Türkçe

    2016

    Eğitim ve ÖğretimUşak Üniversitesi

    İlköğretim Ana Bilim Dalı

    DOÇ. DR. ERKAN DİNÇ