Sabit kanatlı insansız hava araçları için kilitlenme algoritması
Lock-on algorithm for fixed-wing unmanned aerial vehicles
- Tez No: 943504
- Danışmanlar: PROF. DR. MUSTAFA DOĞAN
- Tez Türü: Yüksek Lisans
- Konular: Savunma ve Savunma Teknolojileri, Defense and Defense Technologies
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2025
- Dil: Türkçe
- Üniversite: İstanbul Teknik Üniversitesi
- Enstitü: Lisansüstü Eğitim Enstitüsü
- Ana Bilim Dalı: Savunma Teknolojileri Ana Bilim Dalı
- Bilim Dalı: Savunma Teknolojileri Bilim Dalı
- Sayfa Sayısı: 119
Özet
İnsansız hava araçları (İHA), keşif, gözetleme, hedef tespiti ve angajman gibi kritik görevlerde giderek artan bir rol oynamakta, modern savunma ve güvenlik stratejilerinin ayrılmaz bir parçası haline gelmektedir. Ancak, İHA'ların bu görevleri otonom veya yarı otonom bir şekilde etkinlikle yerine getirebilmesi, özellikle dinamik, karmaşık ve potansiyel olarak düşmanca ortamlarda hedefleri doğru bir şekilde tespit edip kesintisiz takip edebilme yeteneklerine sıkı sıkıya bağlıdır. Mevcut sistemlerde, sınırlı hesaplama kaynaklarına sahip İHA platformlarında gerçek zamanlı, yüksek doğruluklu ve kararlı bir“hedef kilitlenme”mekanizması oluşturmak önemli bir teknolojik zorluk olarak karşımıza çıkmaktadır. Özellikle, anlık hedef kayıpları, yanlış hedef takipleri ve düşük işlem hızları gibi sorunlar, operasyonel etkinliği ciddi şekilde sekteye uğratabilmekte ve görev başarısızlıklarına yol açabilmektedir. Bu tez çalışmasında, tam da bu kritik problemlere odaklanarak, sabit kanatlı İHA'lar için optimum bir kilitlenme algoritması geliştirmek, yani hedefleri hızlı, doğru ve kesintisiz bir şekilde tespit edip takip edebilen bir sistem mimarisi oluşturmak amaçlanmaktadır. Bu amaca ulaşmak için, ilk olarak modern derin öğrenme tabanlı nesne tespit yaklaşımları incelenmiş ve YOLOv8 mimarisinin farklı boyutlardaki varyantları (YOLOv8n'den YOLOv8x'e), özel olarak oluşturulan bir İHA veri seti üzerinde performans (doğruluk ve hız metrikleri) açısından karşılaştırılmıştır. Bu analizler sonucunda, kaynak kısıtlı İHA platformları için en uygun hız-doğruluk dengesini sunan YOLOv8m modeli, temel tespit katmanı olarak belirlenmiş ve çeşitli optimizasyon teknikleriyle (veri artırma, transfer öğrenme) performansı en üst düzeye çıkarılmıştır. Başarılı bir tespitin ardından, hedefin zaman içindeki sürekliliğini sağlamak amacıyla, literatürde yaygın olarak kullanılan SORT, DeepSORT ve ByteTrack gibi farklı takip algoritmaları bu tespit altyapısıyla entegre edilmiştir. Geliştirilen entegre sistemlerin performansı, sadece genel video testleriyle sınırlı kalmamış, aynı zamanda X-Plane uçuş simülatörü aracılığıyla oluşturulan, farklı hava koşulları ve hedef davranışları içeren üç adet gerçekçi senaryo üzerinde de titizlikle sınanmıştır. Bu değerlendirmeler, Saniyedeki Kare Hızı (FPS), Çoklu Nesne Takip Hassasiyeti (MOTP), Kilitlenme Süresi gibi nicel metriklerin yanı sıra, algoritmaların anlık davranışlarını ve olası hata modlarını ortaya koyan nitel görsel analizlerle (simülasyon kayıtlarından alınan ekran görüntüleri) zenginleştirilmiştir. Bu bütüncül yaklaşım, özellikle DeepSORT'un sayısal olarak yüksek kilitlenme süresine rağmen yanlış hedeflere odaklanabildiğini veya SORT'un belirli anlarda hedefi kaybederken ByteTrack'in takibi başarıyla sürdürebildiğini net bir şekilde göstermiştir. Elde edilen kapsamlı bulgular ve karşılaştırmalı analizler, YOLOv8m nesne tespit modeli ile ByteTrack takip algoritmasının entegrasyonunun, İHA'lar için geliştirilen kilitlenme sisteminde en üstün ve dengeli performansı sunduğunu kesin olarak ortaya koymuştur. ByteTrack, yüksek işlem hızını (ortalama 50-66 FPS) korurken, yüksek takip doğruluğu (ortalama MOTP ~0.90) ve özellikle zorlu koşullarda daha kararlı ve kesintisiz bir takip yeteneği sergileyerek diğer algoritmalara kıyasla belirgin bir avantaj sağlamıştır. Bu kombinasyon, İHA'ların hedefi doğru tespit etme, kimliğini koruyarak izleme ve anlık kayıplara karşı direnç gösterme gibi temel kilitlenme gereksinimlerini etkin bir şekilde karşılamıştır. Bu tez, mevcut sabit kanatlı İHA hedef tespit ve takip sistemlerindeki hız, doğruluk ve kararlılık sorunlarına pratik bir çözüm önerisi sunarak literatüre katkıda bulunmaktadır. Önerilen YOLOv8m ve ByteTrack tabanlı sistem, İHA'ların otonom görev yeteneklerinin artırılmasına, operasyonel verimliliğin yükseltilmesine ve görev risklerinin azaltılmasına olanak tanıyarak bu alandaki gelecekteki araştırmalar ve sistem geliştirmeleri için değerli bir referans ve temel oluşturmaktadır.
Özet (Çeviri)
Unmanned aerial vehicles (UAVs) have become indispensable components of modern defense and security strategies, playing diverse and critical roles in reconnaissance, surveillance, target acquisition, and engagement. The full realization of these vehicles' autonomous or semi-autonomous operational capabilities is directly dependent on their ability to accurately detect and continuously track targets in dynamic, complex, and potentially threatening mission environments. However, a significant obstacle to developing a highly accurate and stable“target lock”mechanism within current technological infrastructures is the often-limited computational resources and stringent real-time requirements of UAV platforms. Common operational challenges such as instantaneous target loss, misidentification of objects as targets (false positives), and low processing speeds can severely limit UAV mission effectiveness and even lead to mission failures. This thesis focuses on these critical performance and reliability issues in UAV systems, aiming to develop an optimal locking algorithm specifically for fixed-wing UAV platforms. In other words, the primary objective is to create a system architecture that can detect and track targets at high speeds with superior accuracy and continuous consistency, thereby enhancing the UAV's situational awareness and engagement capabilities. To achieve this comprehensive goal, the methodology involved a thorough examination of modern deep learning-based object detection approaches. Different variants of YOLOv8 (YOLOv8n, YOLOv8s, YOLOv8m, YOLOv8l, and YOLOv8x), one of the most current and powerful architectures in this field, were considered. These models were trained on a specially created and labeled dataset reflecting UAV mission scenarios and systematically compared in terms of fundamental performance metrics such as accuracy ([email protected], [email protected]:0.95) and processing speed (inference time). As a result of these analyses, the YOLOv8m model was chosen as the core detection layer for this thesis, as it best meets the demanding requirements of UAV platforms with limited computational resources, offering high detection accuracy within an acceptable inference time. The performance of this selected model was further maximized through various optimization techniques, including transfer learning, data augmentation (diversifying images with geometric and photometric transformations), and hardware optimization, achieving a remarkable 98.9% success rate in the [email protected] metric. This high-quality and reliable detection infrastructure was considered a critical prerequisite for the subsequent successful performance of tracking algorithms. Following successful object detection, three widely accepted tracking algorithms with different operating principles – SORT (Simple Online and Realtime Tracking), DeepSORT (Deep Simple Online and Realtime Tracking), and ByteTrack – were integrated with this robust detection infrastructure to ensure the continuity of the target's identity and position over time within the video stream. SORT is celebrated for its efficiency and suitability for real-time applications. At its core, SORT employs a Kalman filter, a powerful mathematical tool for estimating the state of a dynamic system from a series of noisy measurements. In this context, the Kalman filter predicts an object's future position and velocity based on its past trajectory. Once new object detections arrive from the detection system, SORT uses the Hungarian algorithm to solve the assignment problem. This algorithm efficiently matches the predicted tracks from the Kalman filter with the new detections, primarily based on their Intersection over Union (IoU) – a measure of spatial overlap. This makes SORT incredibly fast, ideal for scenarios where rapid tracking is paramount. However, its reliance solely on motion cues makes it vulnerable to identity switches when objects cross paths or when objects are temporarily occluded (hidden from view). In such cases, the system might mistakenly assign a new identity to an existing object or switch the identities of two closely moving objects. DeepSORT addresses the limitations of SORT by integrating a sophisticated deep learning model for re-identification. While it retains the fundamental Kalman filter and Hungarian algorithm for motion-based tracking, DeepSORT introduces an additional layer of intelligence. It extracts rich appearance features from each detected object using a pre-trained convolutional neural network (CNN). These unique appearance descriptors are then used in conjunction with the motion-based predictions to associate detections with existing tracks. This means DeepSORT doesn't just consider where an object is going, but also what it looks like. This re-identification capability is crucial for maintaining object identities even after prolonged occlusions or when objects re-enter the scene after being out of sight, significantly reducing identity switches and providing more robust and continuous tracking. However, the computational cost associated with extracting and comparing these deep features increases the processing load, which can lead to a reduction in tracking speed compared to the simpler SORT algorithm. ByteTrack offers a distinct and often superior approach by embracing“tracking by detection”more comprehensively, particularly by considering low-score detections. Unlike many algorithms that discard detections below a certain confidence threshold, ByteTrack believes that even low-confidence detections can hold valuable information. It implements a clever two-stage association strategy. First, it matches high-score detections with existing tracks, similar to other algorithms. Then, in a crucial second stage, it attempts to associate any unmatched tracks with the remaining low-score detections. This“track everything”philosophy helps in recovering objects that might otherwise be lost due to momentary low detection confidence, perhaps during partial occlusions or challenging lighting conditions. By leveraging these otherwise discarded detections, ByteTrack achieves significantly fewer identity switches and more consistent, long-term trajectories, making it particularly effective in complex scenarios like crowded environments or dynamic scenes with frequent occlusions. The performance of these integrated detection and tracking systems, built upon the algorithms described above, was not limited to general-purpose video tests. It was also meticulously and comprehensively tested across three distinct scenarios specifically designed using the X-Plane flight simulator to more realistically model UAV operations. These scenarios included tracking a single target in clear weather, target tracking in rainy and cloudy conditions, and a scenario involving different target models and maneuvers. The evaluation process was enriched with standard quantitative metrics such as Frames Per Second (FPS), Multiple Object Tracking Precision (MOTP), Total and Average Lock-on Time. Additionally, qualitative visual analyses (comparative screenshots from simulation recordings) revealed the real-time behavior of the algorithms, potential error modes, and particularly performance differences during critical moments. This holistic and multi-layered evaluation approach clearly demonstrated, for example, that although the DeepSORT algorithm achieved numerically high“Total Lock-on Time”metrics, visual analyses showed it artificially inflated this duration by tracking non-target elements (sky, irrelevant ground areas, etc.). Similarly, it showed that while the SORT algorithm lost the target in certain challenging conditions (e.g., rainy weather in Scenario 2), the ByteTrack algorithm simultaneously maintained tracking successfully and stably. Comparative analyses, conducted in light of all these comprehensive quantitative and qualitative findings, definitively showed that the integration of the YOLOv8m object detection model with the ByteTrack tracking algorithm offered the most superior, balanced, and operationally reliable performance for the UAV lock-on system. The ByteTrack algorithm demonstrated a distinct advantage over others by maintaining high processing speed (50-66 FPS) while achieving high tracking accuracy (average MOTP value of ~0.90 and above in different scenarios). Crucially, it exhibited stable and continuous tracking capability even in challenging conditions where other algorithms' performance degraded or lost the target, as supported by visual evidence. This exceptional combination effectively and reliably met the fundamental lock-on requirements for UAVs, including accurately detecting a target, maintaining the identity of the detected target over time, and resisting instantaneous losses due to environmental factors or target maneuvers. Consequently, this thesis makes a significant contribution to the existing literature by focusing on persistent fundamental issues in fixed-wing UAV target detection and tracking systems, such as speed, accuracy, and especially tracking stability, and by proposing a practical and high-performance solution to these problems. The proposed and validated YOLOv8m and ByteTrack-based integrated lock-on system, whose effectiveness is proven by both quantitative metrics and qualitative visual analyses, will enable the advancement of UAV autonomous mission capabilities, increase operational efficiency and situational awareness in the field, and reduce potential mission risks. It also establishes a valuable reference source and a solid foundation for future academic research and industrial system development in this critical technology area.
Benzer Tezler
- Sabit kanatlı insansız hava araçları için modelleme ve çevrim-şekillendiren kontrolcü tasarımı
Modeling and loop-shaping control design for fixed-wing unmanned aerial vehicles
ŞEYMA AKYÜREK
Yüksek Lisans
Türkçe
2015
Elektrik ve Elektronik MühendisliğiTOBB Ekonomi ve Teknoloji ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
DOÇ. DR. COŞKU KASNAKOĞLU
PROF. DR. ÜNVER KAYNAK
- Sabit kanatlı insansız hava araçları için döngüde donanımsal benzetim platformu kullanarak çevrim-şekillendiren otopilot tasarımı
Loop shaping controller design for fixed wing aerial vehicles using hardware in the loop platform
EMRE ATLAS
Yüksek Lisans
Türkçe
2017
Elektrik ve Elektronik MühendisliğiTOBB Ekonomi ve Teknoloji ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
DOÇ. DR. COŞKU KASNAKOĞLU
- Vision-aided landing for fixed wing unmanned aerial vehicle
Sabit kanatlı ınsansız hava araçları için görüntü işleme ile otomatik iniş
ENGİN ESİN
Yüksek Lisans
İngilizce
2016
Havacılık MühendisliğiOrta Doğu Teknik ÜniversitesiHavacılık ve Uzay Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. ALİ TÜRKER KUTAY
- Sabit kanatlı insansız hava araçları için ivme geribeslemeli kontrolcü tasarımı ve yeni bir açısal ivme kestirim yöntemi
Acceleration feedback controller design for fixed-wing uavs and a novel angular acceleration estimation method
SERKAN ÜNSAL
Doktora
Türkçe
2022
Elektrik ve Elektronik MühendisliğiYıldız Teknik ÜniversitesiKontrol ve Otomasyon Mühendisliği Ana Bilim Dalı
PROF. DR. ŞEREF NACİ ENGİN
- Sabit kanatlı insansız hava araçlarında çoklu otopilot sistemleri
Redundant autopilot systems for fixed wing uav
PINAR YÜCEL
Yüksek Lisans
Türkçe
2020
Elektrik ve Elektronik MühendisliğiTOBB Ekonomi ve Teknoloji ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
PROF. DR. COŞKU KASNAKOĞLU