Geri Dön

Quantization robustness to input degradations for object detection

Girdi bozulmalarına karşı nesne tespiti için kuantizasyon dayanıklılığı

  1. Tez No: 964966
  2. Yazar: TOGHRUL KARIMOV
  3. Danışmanlar: Assist. Prof. Dr. HASSAN IMANI
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2025
  8. Dil: İngilizce
  9. Üniversite: Bahçeşehir Üniversitesi
  10. Enstitü: Lisansüstü Eğitim Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 94

Özet

This thesis investigates the robustness of post-training quantized object detection models against input degradations, focusing on YOLO-based architectures. While quantization significantly improves inference efficiency by reducing model size and computational load, its impact on model robustness in real-world conditions—such as noise, blur, low contrast, and compression—is underexplored. The study benchmarks multiple quantized variants (FP16, INT8 static, UINT8 dynamic) against the FP32 baseline using degraded versions of the COCO dataset. A novel degradation-aware calibration method is proposed for static INT8 quantization, which mixes clean and degraded images during calibration to enhance robustness. Experimental results show that degradation-aware quantization improves detection stability under various corruptions with minimal trade-offs in performance on clean data. These findings provide actionable insights for deploying efficient and reliable object detectors on edge devices operating in uncontrolled environments.

Özet (Çeviri)

Bu tez, YOLO tabanlı mimariler üzerine odaklanarak, eğitim sonrası kuantize edilmiş nesne tespiti modellerinin girdi bozulmalarına karşı dayanıklılığını incelemektedir. Kuantizasyon, model boyutunu ve hesaplama yükünü azaltarak çıkarım verimliliğini önemli ölçüde artırsa da, gürültü, bulanıklık, düşük kontrast ve sıkıştırma gibi gerçek dünya koşullarında modelin dayanıklılığı üzerindeki etkisi yeterince araştırılmamıştır. Bu çalışma, COCO veri kümesinin bozulmuş sürümleri kullanılarak FP32 referans modeli ile çeşitli kuantize edilmiş varyantları (FP16, INT8 statik, UINT8 dinamik) karşılaştırmalı olarak değerlendirmektedir. Statik INT8 kuantizasyonu için, kalibrasyon sırasında temiz ve bozulmuş görüntülerin karıştırıldığı yeni bir“bozulma farkında”kalibrasyon yöntemi önerilmektedir. Deneysel sonuçlar, bozulma farkında kuantizasyonun çeşitli bozulmalar altında tespit kararlılığını artırdığını ve temiz veriler üzerindeki performansta minimum kayıpla çalıştığını göstermektedir. Bu bulgular, kontrolsüz ortamlarda çalışan uç cihazlarda verimli ve güvenilir nesne tespiti çözümleri için uygulanabilir içgörüler sunmaktadır.

Benzer Tezler

  1. Stochastic bitstream-based vision and learning machines

    Stokastik bit akışı tabanlı görü ve öğrenme makineleri

    SERCAN AYGÜN

    Doktora

    İngilizce

    İngilizce

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    PROF. DR. ECE OLCAY GÜNEŞ

  2. Ai-based visual odometry implementation on an embedded system

    Yapay zeka tabanlı görsel odometrinin gömülü bir sistemde gerçeklemesi

    OĞUZHAN BÜYÜKSOLAK

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Savunma ve Savunma Teknolojileriİstanbul Teknik Üniversitesi

    Savunma Teknolojileri Ana Bilim Dalı

    PROF. DR. ECE OLCAY GÜNEŞ

  3. Quantization based data hiding strategies with visual applications

    Nicemleme tabanlı bilgi saklama stratejileri ve görsel uygulamaları

    ERSİN ESEN

    Doktora

    İngilizce

    İngilizce

    2010

    Elektrik ve Elektronik MühendisliğiOrta Doğu Teknik Üniversitesi

    Elektrik ve Elektronik Mühendisliği Bölümü

    DOÇ. DR. A. AYDIN ALATAN

  4. Audio watermarking using DWT of second level decomposition of low frequency and using RMS on approximation coefficients

    Düşük frekansı ile ilgili DWT ikinci düzeyi ayrıştırma ve tahmini katsayıları ile ilgili RMS kullanımı ile sesli damgalama

    HEYAM ESSAM JİBRAEL MARAHA

    Yüksek Lisans

    İngilizce

    İngilizce

    2014

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolÇankaya Üniversitesi

    Matematik ve Bilgisayar Bilimleri Ana Bilim Dalı

    Assist. Prof. Dr. REZA HASSANPOUR

  5. NFT'lerin video filigranlamada kullanımı

    Application of NFTs in video watermarking

    IBRAHIMA SORY CAMARA

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKonya Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. İSMAİL BABAOĞLU