Investigation of the performance of deep learning-based object detection systems
Derin öğrenme tabanlı nesne tespit sistemlerinin performansının incelenmesi
- Tez No: 958585
- Danışmanlar: DOÇ. DR. YASİN KAYA
- Tez Türü: Doktora
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2025
- Dil: İngilizce
- Üniversite: Adana Alparslan Türkeş Bilim Ve Teknoloji Üniversitesi
- Enstitü: Lisansüstü Eğitim Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 106
Özet
Son yıllarda, derin öğrenme (DÖ) metodolojilerindeki hızlı gelişmeler nedeniyle bilgisayarla görme ile nesne algılama (NA) konusunda önemli ilerlemeler kaydedildi. Bununla birlikte, bölge tabanlı evrişimli sinir ağları (R-CNN'ler) çoğu gereksiz veya alakasız olan çok sayıda aday bölgenin üretilmesi nedeniyle genellikle hesaplama yetersizliklerinden muzdariptir. Tek aşamalı algoritmalar NA'yı hızlandırmış olsa da, yüksek frekanslı gürültünün ve alakasız ayrıntıların varlığı bu modelleri arka plan düzensizliklerine karşı hassas hale getirir. Bu sınırlamaları gidermek için, bu çalışma nesne algılama işlemi için giriş görüntüsündeki yüksek frekanslı gürültüyü azaltan yeni bir yaklaşım sunmaktadır. Önerilen model özellikle İlgi Alanı (IA) üretimi ve nesne algılama arasında bir denge sağlayan yeni bir Uyarlanabilir Dolgu (UD) mekanizması ve İlgi Alanı dedektöründen oluşmaktadır. R-CNN kullanılarak beş kuş veriseti üzerinde yürütülen deneysel değerlendirmeler, yöntemimizin Kesişim Birleşim Oranı (IoU) değeri 0,5'ten büyük olan bölge önerilerinin oranını %20,93'ten %65,17'e çıkardığını göstermektedir. Ayrıca, pozitif aday bölgelerin sayısı eğitim sırasında %330 ve test sırasında %726 artarken, gereksiz öneriler %55,48 oranında azaltılmıştır. Önerilen model YOLOv8 için de kullanılmış ve 6 kuş türüne ait 351 görüntü ile test edilmiştir. Model mAp50'yi 0,954'ten 0,984'e ve mAP50-95'i 0,633'ten 0,781'e çıkarmıştır.
Özet (Çeviri)
In recent years, significant advancements have been achieved in object detection (OD) within computer vision due to rapid developments in deep learning (DL) methodologies. Nevertheless, region-based convolutional neural networks (R-CNNs) often suffer from computational inefficiencies due to the generation of an excessive number of candidate regions, many of which are redundant or irrelevant. Although single-stage algorithms have accelerated OD, the presence of high-frequency noise and irrelevant details makes these models sensitive to background disturbances. To adress these limitations, this study introduces a novel approach reducing the high-frequency noise in the input image for the object detection task. Specifically, the proposed model comprises a novel Adaptive Padding (AP) mechanism and Region of Interest (RoI) detector, which provides a balance between RoI generation and object detection. Experimental evaluations conducted on five bird datasets using R-CNN demonstrate that our method increased the proportion of region proposals with an Intersection over Union (IoU) greater than 0,5 from 20,93% to 65,17%. Furthermore, the number of positive proposals increased by 330% during training and 726% during testing, while redundant proposals were reduced by 55,48%. The proposed model was also used for YOLOv8 and tested with 351 images of 6 bird species. The model increased the mAp50 from 0,954 to 0,984 and the mAP50-95 from 0,633 to 0,781.
Benzer Tezler
- Investigation of artificial intelligence-based point cloud semantic segmentation
Yapay zeka tabanlı nokta bulutu semantik bölümlendirmesinin incelenmesi
MUHAMMED ENES ATİK
Doktora
İngilizce
2022
Jeodezi ve Fotogrametriİstanbul Teknik ÜniversitesiGeomatik Mühendisliği Ana Bilim Dalı
PROF. DR. ZAİDE DURAN
- Evaluation of deep learning based multiple object trackers
Derin öğrenme tabanlı çoklu nesne takipçilerinin değerlendirilmesi
OMAR MOURED
Yüksek Lisans
İngilizce
2020
Elektrik ve Elektronik MühendisliğiOrta Doğu Teknik ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
Prof. GÖZDE AKAR
- Deep learning based three dimensional face expression recognition using geometry images from three dimensional face models
Üç boyutlu yüz modellerinden elde edilen geometri görüntüleri kullanılan derin öğrenme tabanlı üç boyutlu yüz ifadelerini tanıma
NEŞE GÜNEŞ
Yüksek Lisans
İngilizce
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. ULUĞ BAYAZIT
- Deprem sonrası betonarme kolonlarda boyuna donatı burkulmasının makine öğrenmesi ile tespiti
Detection of longitudinal reinforcement buckling in reinforced concrete columns post-earthquake by machine learning
BAHADIR GÜLEŞMEN
Yüksek Lisans
Türkçe
2025
İnşaat Mühendisliğiİstanbul Teknik Üniversitesiİnşaat Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ÖMER TUĞRUL TURAN
- Derin öğrenme tabanlı yöntemler ile GPR görüntülerinde obje tespiti
Object detection in GPR images with deep learning based methods
ORHAN APAYDIN
Yüksek Lisans
Türkçe
2023
Jeofizik Mühendisliğiİstanbul Teknik ÜniversitesiJeofizik Mühendisliği Ana Bilim Dalı
DOÇ. DR. TURGAY İŞSEVEN