Geri Dön

Gerçek zamanlı nesne algılama algoritmalarının karşılaştırılması

Comparision of real-time object detection algorithms

  1. Tez No: 942305
  2. Yazar: ELİF NUR YILMAZ
  3. Danışmanlar: PROF. DR. TUĞBA SELCEN NAVRUZ
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Elektrik ve Elektronik Mühendisliği, Computer Engineering and Computer Science and Control, Electrical and Electronics Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2025
  8. Dil: Türkçe
  9. Üniversite: Gazi Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 122

Özet

Son yıllarda yapay zekâ ve derin öğrenme alanlarında yaşanan teknolojik ilerlemeler, bilgisayarla görme sistemlerinin özellikle nesne algılama konusunda büyük bir gelişim göstermesini sağlamıştır. Bu tez çalışması kapsamında, karşılaştırmaya dâhil edilen modeller arasında en güncel YOLO ailesine ait YOLOv8, YOLOv9, YOLOv10 ve YOLO11 modellerinin küçük (s), orta (m) ve büyük (l) varyantları, geleneksel ancak yaygın olarak kullanılan SSD300-VGG16, ve ölçeklenebilir yapısıyla dikkat çeken EfficientDet (D0–D7) serisi yer almaktadır. Tüm modeller, MS COCO 2017 veri kümesi kullanılarak, PyTorch 2.0.1 çerçevesinde aynı donanım (Intel i7 CPU, 16 GB RAM, NVIDIA RTX 3050 GPU) ve yazılım konfigürasyonları altında test edilmiştir. Karşılaştırma, yalnızca doğruluk metrikleriyle sınırlı kalmamış; saniyedeki kare sayısı (FPS), çıkarım süresi (inference time), kesinlik (precision), duyarlılık (recall), F1-skoru, Ortalama Ortalama Hassasiyet (mAP), mAP50:95 ve Kesişim-Birleşim Oranı (IoU) gibi performans parametreleri üzerinden gerçekleştirilmiştir. Deneysel sonuçlar, özellikle YOLOv8s ve YOLOv10s modellerinin hem yüksek FPS değerleri hem de tatmin edici doğruluk skorları ile ön plana çıktığını göstermektedir. Buna karşın, SSD300-VGG16 modeli, rakiplerinin oldukça gerisinde kalmaktadır. EfficientDet D4-D7 modelleri yüksek yerelleştirme başarısıyla dikkat çekmektedir. Tezde ayrıca, modellerin zorlu koşullardaki dayanıklılığı da test edilmiştir. YOLOv10 ve YOLO11 modellerinin daha kararlı sonuçlar üretmiştir. Bunlara ek olarak, tezde kod seviyesinde yapılan optimizasyonların da performans üzerindeki etkisi ayrıntılı olarak ele alınmıştır. Bu sonuçlar ile yazılım optimizasyonunun da gerçek zamanlı sistemlerde önemli rol oynadığını açıkça ortaya koymaktadır. Sonuç olarak bu çalışma, farklı kullanım senaryoları için en uygun modeli belirlemede kapsamlı bir rehber sunmayı amaçlamaktadır. Gerçek zamanlılık, doğruluk ve sistem kaynaklarının dengeli kullanımı gibi pratik kaygıları ele alan bu tez; hem akademik alanda araştırma yapanlar hem de endüstriyel çözümler geliştiren profesyoneller için yol gösterici niteliktedir.

Özet (Çeviri)

In recent years, technological advances in the fields of artificial intelligence and deep learning have enabled computer vision systems to make significant progress especially in object detection. Within the scope of this thesis, the models included in the comparison include small (s), medium (m) and large (l) variants of the latest YOLO family YOLOv8, YOLOv9, YOLOv10 and YOLO11 models, the traditional but widely used SSD300-VGG16, and the EfficientDet (D0–D7) series, which stands out with its scalable structure. All models were tested using the MS COCO 2017 dataset within the PyTorch 2.0.1 framework under the same hardware (Intel i7 CPU, 16 GB RAM, NVIDIA RTX 3050 GPU) and software configurations. The comparison was not limited to accuracy metrics only; The performance parameters such as frames per second (FPS), inference time, precision, recall, F1-score, Mean Average Precision (mAP), mAP50:95 and Intersection-Joinage Ratio (IoU) were used. Experimental results show that especially YOLOv8s and YOLOv10s models stand out with both high FPS values and satisfactory accuracy scores. On the other hand, SSD300-VGG16 model lags far behind its competitors. EfficientDet D4-D7 models stand out with their high localization success. The thesis also tested the durability of the models under difficult conditions. YOLOv10 and YOLO11 models produced more stable results. In addition, the effect of optimizations made at the code level on performance is discussed in detail in the thesis. These results clearly show that software optimization also plays an important role in real-time systems. As a result, this study aims to provide a comprehensive guide to determine the most suitable model for different usage scenarios. Addressing practical concerns such as real-time, accuracy and balanced use of system resources, this thesis is a guide for both academic researchers and professionals developing industrial solutions.

Benzer Tezler

  1. Design, implementation and comparison ofsensor fusion methods for object detection and trackingbased on multiple 3D lidar sensors

    Çoklu 3D lidar sensörleri üzerindenesne algılama ve takibi için sensör füzyon yöntemlerinintasarımı, uygulaması ve karşılaştırılması

    ELİF AKSU TAŞDELEN

    Yüksek Lisans

    İngilizce

    İngilizce

    2020

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Kontrol ve Otomasyon Mühendisliği Ana Bilim Dalı

    DOÇ. DR. VOLKAN SEZER

  2. Simulation, evaluation and study of digital breast tomosynthesis imaging based on compressed sensing methods using total variation minimization

    Sayısal meme tomosentezi görüntülemenin toplam değişinti minimizasyonu kullanarak sıkıştırılmış algılama yöntemleri temelli benzetimi, değerlendirmesi ve çalışması

    SAEEED SEYYEDI

    Yüksek Lisans

    İngilizce

    İngilizce

    2014

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. İSA YILDIRIM

  3. A modular multı-stage method for vehıcle detectıon and classıfıcatıon ın low resolutıon ımages

    Düşük çözünürlüklü görüntülerde araç tespi̇ti̇ ve siniflandirmasi i̇çi̇n birden fazla aşamali modüler bi̇r yöntem

    BAMOYE MAIGA

    Doktora

    İngilizce

    İngilizce

    2025

    Elektrik ve Elektronik MühendisliğiAtılım Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    DOÇ. DR. YASER DALVEREN

  4. Havalimanı pistlerinde yabancı madde tespiti için derin öğrenme yaklaşımı

    Deep learning approach for foreign object detection on airport runways

    NECİP ŞAHAMETTİN KÜÇÜK

    Yüksek Lisans

    Türkçe

    Türkçe

    2025

    Sivil HavacılıkFırat Üniversitesi

    Havacılık Bilimi ve Teknolojileri Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ÖMER OSMAN DURSUN

  5. Makine öğrenimi algoritmalarını kullanarak gerçek zamanlı robot ile nesne algılama ve tanıma

    Object detection and recognition with real-time robot using machine learning algorithms

    ALI JAMAL JALIL

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKütahya Dumlupınar Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ SOYDAN SERTTAŞ