Geri Dön

Investigation of the performance of deep learning-based object detection systems

Derin öğrenme tabanlı nesne tespit sistemlerinin performansının incelenmesi

  1. Tez No: 958585
  2. Yazar: BARIŞ DİNÇ
  3. Danışmanlar: DOÇ. DR. YASİN KAYA
  4. Tez Türü: Doktora
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2025
  8. Dil: İngilizce
  9. Üniversite: Adana Alparslan Türkeş Bilim Ve Teknoloji Üniversitesi
  10. Enstitü: Lisansüstü Eğitim Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 106

Özet

Son yıllarda, derin öğrenme (DÖ) metodolojilerindeki hızlı gelişmeler nedeniyle bilgisayarla görme ile nesne algılama (NA) konusunda önemli ilerlemeler kaydedildi. Bununla birlikte, bölge tabanlı evrişimli sinir ağları (R-CNN'ler) çoğu gereksiz veya alakasız olan çok sayıda aday bölgenin üretilmesi nedeniyle genellikle hesaplama yetersizliklerinden muzdariptir. Tek aşamalı algoritmalar NA'yı hızlandırmış olsa da, yüksek frekanslı gürültünün ve alakasız ayrıntıların varlığı bu modelleri arka plan düzensizliklerine karşı hassas hale getirir. Bu sınırlamaları gidermek için, bu çalışma nesne algılama işlemi için giriş görüntüsündeki yüksek frekanslı gürültüyü azaltan yeni bir yaklaşım sunmaktadır. Önerilen model özellikle İlgi Alanı (IA) üretimi ve nesne algılama arasında bir denge sağlayan yeni bir Uyarlanabilir Dolgu (UD) mekanizması ve İlgi Alanı dedektöründen oluşmaktadır. R-CNN kullanılarak beş kuş veriseti üzerinde yürütülen deneysel değerlendirmeler, yöntemimizin Kesişim Birleşim Oranı (IoU) değeri 0,5'ten büyük olan bölge önerilerinin oranını %20,93'ten %65,17'e çıkardığını göstermektedir. Ayrıca, pozitif aday bölgelerin sayısı eğitim sırasında %330 ve test sırasında %726 artarken, gereksiz öneriler %55,48 oranında azaltılmıştır. Önerilen model YOLOv8 için de kullanılmış ve 6 kuş türüne ait 351 görüntü ile test edilmiştir. Model mAp50'yi 0,954'ten 0,984'e ve mAP50-95'i 0,633'ten 0,781'e çıkarmıştır.

Özet (Çeviri)

In recent years, significant advancements have been achieved in object detection (OD) within computer vision due to rapid developments in deep learning (DL) methodologies. Nevertheless, region-based convolutional neural networks (R-CNNs) often suffer from computational inefficiencies due to the generation of an excessive number of candidate regions, many of which are redundant or irrelevant. Although single-stage algorithms have accelerated OD, the presence of high-frequency noise and irrelevant details makes these models sensitive to background disturbances. To adress these limitations, this study introduces a novel approach reducing the high-frequency noise in the input image for the object detection task. Specifically, the proposed model comprises a novel Adaptive Padding (AP) mechanism and Region of Interest (RoI) detector, which provides a balance between RoI generation and object detection. Experimental evaluations conducted on five bird datasets using R-CNN demonstrate that our method increased the proportion of region proposals with an Intersection over Union (IoU) greater than 0,5 from 20,93% to 65,17%. Furthermore, the number of positive proposals increased by 330% during training and 726% during testing, while redundant proposals were reduced by 55,48%. The proposed model was also used for YOLOv8 and tested with 351 images of 6 bird species. The model increased the mAp50 from 0,954 to 0,984 and the mAP50-95 from 0,633 to 0,781.

Benzer Tezler

  1. Investigation of artificial intelligence-based point cloud semantic segmentation

    Yapay zeka tabanlı nokta bulutu semantik bölümlendirmesinin incelenmesi

    MUHAMMED ENES ATİK

    Doktora

    İngilizce

    İngilizce

    2022

    Jeodezi ve Fotogrametriİstanbul Teknik Üniversitesi

    Geomatik Mühendisliği Ana Bilim Dalı

    PROF. DR. ZAİDE DURAN

  2. Evaluation of deep learning based multiple object trackers

    Derin öğrenme tabanlı çoklu nesne takipçilerinin değerlendirilmesi

    OMAR MOURED

    Yüksek Lisans

    İngilizce

    İngilizce

    2020

    Elektrik ve Elektronik MühendisliğiOrta Doğu Teknik Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    Prof. GÖZDE AKAR

  3. Deep learning based three dimensional face expression recognition using geometry images from three dimensional face models

    Üç boyutlu yüz modellerinden elde edilen geometri görüntüleri kullanılan derin öğrenme tabanlı üç boyutlu yüz ifadelerini tanıma

    NEŞE GÜNEŞ

    Yüksek Lisans

    İngilizce

    İngilizce

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. ULUĞ BAYAZIT

  4. Deprem sonrası betonarme kolonlarda boyuna donatı burkulmasının makine öğrenmesi ile tespiti

    Detection of longitudinal reinforcement buckling in reinforced concrete columns post-earthquake by machine learning

    BAHADIR GÜLEŞMEN

    Yüksek Lisans

    Türkçe

    Türkçe

    2025

    İnşaat Mühendisliğiİstanbul Teknik Üniversitesi

    İnşaat Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ÖMER TUĞRUL TURAN

  5. Derin öğrenme tabanlı yöntemler ile GPR görüntülerinde obje tespiti

    Object detection in GPR images with deep learning based methods

    ORHAN APAYDIN

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    Jeofizik Mühendisliğiİstanbul Teknik Üniversitesi

    Jeofizik Mühendisliği Ana Bilim Dalı

    DOÇ. DR. TURGAY İŞSEVEN