Geri Dön

Radar target detection using improved transformer neural networks

Geliştirilmiş transformer sinir ağları ile radar hedef tespiti

  1. Tez No: 949434
  2. Yazar: SENA ÇAYBAŞI
  3. Danışmanlar: PROF. DR. IŞIN ERER
  4. Tez Türü: Yüksek Lisans
  5. Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2025
  8. Dil: İngilizce
  9. Üniversite: İstanbul Teknik Üniversitesi
  10. Enstitü: Lisansüstü Eğitim Enstitüsü
  11. Ana Bilim Dalı: Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Elektronik Mühendisliği Bilim Dalı
  13. Sayfa Sayısı: 87

Özet

Radar sistemleri; elektromanyetik dalgalar vasıtasıyla hedeflerin konum, hız ve yön bilgilerini tespit eden, gözetleme, haritalama, hava durumu bilgisi üretme gibi birçok farklı alanda önemli bir yere sahip olan sistemlerdir. Farklı kullanım alanlarına sahip olmasına rağmen radar sistemlerinin en temel fonksiyonu hedef tespitidir. Radarlarda hedef tespit işlemi, ham radar verilerinin işlenerek anlamlı bilgiler çıkarma süreci olarak tanımlanır. Anlamlı bilgiler çıkarma sürecinde, gerçek dünyadan elde edilen veriler genellikle karmaşık yapıdadırlar ve gürültü barındırırlar. Ortamın kargaşa (clutter) barındırması, radardan alınan verilerin anlaşılmasını zorlaştırabilmektedir. Girişimler, çoklu yansımalar, hedeflerin düşük radar kesit alanlarına sahip olması ve çevresel faktörler nedeniyle hedef tespiti zorlu hale gelebilmektedir. Bu nedenle radar sinyal işleme yöntemlerinin; özellikle hedef tespiti aşamasında, yüksek doğruluk ve güvenilirlikte çalışması kritik bir öneme sahip olmaktadır. Radar verileri, genellikle Range-Doppler (menzil-Doppler) matrisi biçiminde temsil edilirler. Bu matrisin yatay ekseni, hedefin Doppler frekans kaymasını; yani hedefin hareket hızını gösterirken, dikey eksen ise hedefin menzil bilgisini içermektedir. Range-Doppler matrisi, ortamın iki boyutlu bir görüntüsü olarak ele alınabilmekte ve görüntü işleme teknikleri kullanılarak analiz edilebilmektedir. Geleneksel yöntemlerde; radar hedef tespiti yapabilmek için; ortamdan yansıyan sinyal seviyesinin üstünde kalacak şekilde sabit bir eşik seviyesi belirlenmektedir. Bu seviyenin üzerinde kalan sinyallere bakılarak, ilgili verinin tespit olduğuna dair yorum yapılabilmektedir. Ancak gürültünün ve ortam dağılımının değişken olduğu durumlarda, sabit eşik uygulanması yanlış tespitlerin ortaya çıkmasına sebep olmaktadır. Bu durumun önüne geçmek için, değişen koşullara uygun adaptif bir eşik uygulaması gerekmektedir. Yaygın olarak kullanılan adaptif eşikleme yöntemlerinden biri, Sabit Yanlış Alarm Oranı (Constant False Alarm Rate, CFAR) algoritmalarıdır. CFAR, hedef hücresinin çevresinde yer alan referans hücrelerinin istatistiksel özelliklerini baz alarak eşik değer belirlemekte ve bu eşik değerin üzerindeki sinyalleri hedef olarak algılamaktadır. Bu algoritmanın temel avantajı, yanlış alarm oranını kontrol altında tutabilmesidir. Hücre Ortalama (Cell Averaging, CA), En Küçük Hücre Ortalama (Smallest Of Cell Averaging, SOCA), En Büyük Hücre Ortalama (Greatest of CFAR, GOCA) ve Sıralı İstatistikler (Ordered Statistics, OS) en yaygın kullanılan CFAR algoritmalarındandır. CA-CFAR, çevredeki referans hücrelerin ortalama güç seviyesini hesaplayarak tespit eşiğini belirlemektedir. SOCA-CFAR, en düşük güç seviyesine sahip referans hücreleri kullanarak adaptif eşik belirlemekte ve özellikle düşük SNR ortamlarında yanlış alarmları azaltmada etkili bir yöntem olarak literatürde geçmektedir. GOCA-CFAR ise en yüksek güç seviyesine sahip referans hücrelere dayalı bir eşik belirleyerek, yoğun hedef bölgelerinde daha iyi tespit performansı sağlamaktadır. OS-CFAR, referans hücreler içindeki sıralı istatistiklere dayanarak eşik belirleme yapmakta ve heterojen kargaşa ortamlarında daha dengeli bir tespit performansı sunmaktadır. Genellikle kargaşadan etkilenilen ortamlarda OS-CFAR tercih edilmesiyle beraber bu yöntemler, radar ortamındaki gürültü ve kargaşaya adapte olarak yanlış alarm oranını kontrol altında tutmayı amaçlamaktadır. Ancak CFAR yöntemlerinin başarısı, radar ortamının homojen ve istatistiksel varsayımlara uygun olmasına bağlı olması nedeniyle CFAR tabanlı geleneksel yöntemler gerçek radar uygulamalarında özellikle yüksek karmaşıklık ve gürültü altında sınırlamalarla karşılaşmaktadır. CFAR algoritmaları gibi geleneksel yaklaşımlar önceden belirlenmiş istatistiksel modellere dayalı olmaları ve çevresel değişikliklere karşı duyarlı olmaları nedeniyle hedef tespiti zor bir problem haline gelmektedir. Bu kısıtlamalardan kurtulmak için, geleneksel yöntemlere alternatif olarak derin öğrenme tabanlı yaklaşımlar kullanılmaya başlanmıştır. Derin öğrenmeyle hedef tespiti konusunda literatürde karşımıza çıkan ilk yöntemlerden biri CNN'dir. Evrişimli Sinir Ağları (Convolutional Neural Network, CNN), görüntülerdeki özellikleri öğrenme ve tanımlama yeteneğine sahiptirler. Bu özellikleri nedeniyle, radar hedef algılaması için büyük bir potansiyele sahip oldukları görülmektedir. Ancak CNN'ler genellikle görüntüde yer alan küçük bir alandaki piksellere odaklanmaktadır ve bu da görüntüdeki daha büyük ve daha uzak alanlar arasındaki bağlantıları yakalamalarını zorlaştırmaktadır. Sonuç olarak, görüntüdeki genel bağlamın çıkarılması CNN için zor bir problem haline gelmektedir. Bu sorunu aşmak için, Görsel Dönüştürücü (Vision Transformer, ViT) gibi transformer tabanlı modeller tercih edillmektedir. ViT görüntüyü küçük parçalara ayırıp analiz etmektedir ve bu parçalar arasındaki uzun mesafeli ilişkileri öğrenmek için bir dikkat mekanizması kullanmaktadır. Bu mekanizma sayesinde, her bir girdinin bağlam içirisindeki önemi değerlendirilmekte ve uzun vadeli ilişkiler yakalanarak bilgiyi daha etkili modellemesine imkan tanımaktadır. Ancak ViT'in sahip olduğu karmaşık yapı sebebiyle buna alternatif olarak literatürde karşımıza Swin Transformer modelleri çıkmaktadır. Pencereleme üzerinden dikkat mekanizması gerçekleyen Swin Transformer modelleri karmaşıklık bakımından daha efektif modellerdir. Her ne kadar Swin Transformer, model karmaşıklığı bakımından daha verimli görünse de, pencereleme üzerinden dikkat mekanizması uygulandığı için radar gibi küresel ilişkilerin önemli olduğu verilerde modelin yetersiz öğrenmesine ve eğitim sırasında dengesizlikler olmasına neden olabilmektedir. Ayrıca Swin Transformer, özellikle büyük veri kümelerinde etkin performans sergileyen bir model olduğundan, veri kümesinin yetersiz olduğu durumlarda yeterli genelleme yapamayarak aşırı öğrenmeye daha yatkın hale gelmektedir. Bu durum eğitim sürecinde dengesizliklere yol açabilmektedir. ViT, CNN mimarisinden daha karmaşık bir yapıya sahip olduğundan, daha büyük veri kümeleriyle çalışması gerekmektedir. Swin Transformer modelleri ise ViT'e göre daha büyük veri kümeleri gerektirmesi ve veri genellemesindeki eksikliğinden dolayı daha az karmaşıklığa sahip olsa da az veri ile daha yüksek bir hedef tespit performansı elde etmek mümkün olmamaktadır. Bunun yerine, radar verisinde menzil ve Doppler eksenlerinin birlikte ele alınıp global ilişkilerin daha iyi öğrenilebileceği ve genelleme kabiliyeti daha yüksek olan modellere ihtiyaç duyulmaktadır. Bu sebeple, bu tez, az veri ile daha yüksek performans göstermesini sağlamak için geliştirilmiş ViT mimarisine dayalı yeni radar hedef tespit yöntemleri önermektedir. Bu tez çalışmasında, modifiye edilmiş iki farklı derin öğrenme tabanlı model kullanılmaktadır. Standart ViT yapılarında yer alan Multi-Layer Perceptron (MLP) katmanı, özellikle karmaşık radar ortamlarında modelin genelleme kapasitesini sınırlandırabildiği için ilk olarak MLP katmanı yerine, evrişim katmanı içeren geliştirilmiş bir ileri ağ (feedforward) yapısı önerilmektedir. Bu yapı ile hedef tespitinin kargaşa varlığında, daha doğru bir şekilde yapılması amaçlanmaktadır. Önerilen diğer yöntem ise, sinyallerin sahip olduğu özniteliklerin daha etkili bir şekilde çıkarılması ve işlenmesine olanak tanıyan hibrit bir modeldir. Bu model, paralel olarak çalışan bir CNN ve geliştirilmiş ViT mimarisinden oluşmaktadır. Hibrit modelde, giriş görüntüsünden elde edilen özellik haritaları hem CNN hem de geliştirilmiş ViT yapısına paralel olarak gönderilmektedir. Her iki yapı da özellikleri kendi mimarilerine özgü bir şekilde işlemektedir. CNN yapısı; özellikle görüntü verisindeki kenar, doku ve şekilleri başarılı şekilde çıkarırken; ViT'ler uzun süreli bağıntıları modellemede üstünlük sağlamaktadır. Bu iki yapının kombinasyonu, hedef tespit performansını artırıcı etki meydana getirmektedir. Radar verisi, ortama bağlı olarak karmaşık ve yüksek kargaşa içeren veriler barındırabilmektedir. Bu nedenle, derin öğrenme modellerinin eğitim aşamasında, modelin hem çevresel hem de zamansal özellikleri öğrenebilmesi model başarısı için etkin rol oynamaktadır. Bu çalışmada kullanılan veri seti, hem sentetik hem de gerçek radar sistemlerinden toplanmış veriler ile oluşturulmuştur. Sentetik veriler, hedeflerin farklı konum, hız ve genlik özelliklerine göre çeşitlendirilirken; gerçek veriler ise gürültü, kargaşa gibi çevresel etmenleri içeren sinyaller barındırmaktadır. Model eğitimi sürecinde, sentetik ve gerçek veri kümesi eğitim, doğrulama ve test alt kümelerine ayrılmış; benzetimler sentetik ve gerçek veriler için ayrı ayrı gerçekleştirilmiştir. Elde edilen bulgular; önerilen ViT ve CNN-ViT hibrit modellerinin, geleneksel CFAR ve CNN modellerine kıyasla daha yüksek hedef tespit performansı sağladığını göstermektedir. Sadece gürültünün bulunduğu sentetik verilerde, tüm derin öğrenme yöntemlerinin hedef tespit doğruluk oranı %98 mertebelerinde kalırken; gerçek radar ortam koşullarında CNN yönteminin %88, önerilen ViT modelinin %89 ve önerilen hibrit modelin %90 mertebelerinde hedef tespit doğruluğu sağladığı gözlemlenmiştir. Sonuç olarak bu tez çalışmasında, geleneksel radar hedef tespit algoritmalarına alternatif yöntemler önerilmiştir. Önerilen yöntemler, klasik yöntemlerin ötesine geçen, derin öğrenme tabanlı yeni yaklaşımlar sunmaktadır. Geliştirilmiş ViT mimarisi ve CNN-ViT hibrit modeli, radar hedef tespitinde doğruluk ve karmaşık ortam koşullarına adaptasyon açısından önemli avantajlar sağlamaktadır.

Özet (Çeviri)

Radar systems, which use electromagnetic waves to determine a target's position, speed, and direction, are essential in a variety of fields, including mapping, weather forecasting, and surveillance. Despite having different areas of use, the most basic function of radar systems is target detection. Target detection in radars is defined as the process of processing raw radar data and extracting meaningful information. In the process of extracting meaningful information, data obtained from the real world is usually complex and contains clutter. Clutter in the environment can make it difficult to understand the data received from the radar. Target detection can be challenging due to interferences, multiple reflections, low radar cross-section areas of targets and environmental factors. Therefore, it is of critical importance that radar signal processing methods operate with high accuracy and reliability, especially during the target detection phase. In traditional methods; in order to perform radar target detection, a fixed threshold level is determined to remain above the level of the signal reflected from the environment. The target detection decision is made by examining the signals remaining above this level. However, in cases where the noise and environment distribution are variable, applying a fixed threshold causes false detections. In order to prevent this situation, an adaptive threshold application suitable for changing conditions is required. One of the widely used adaptive thresholding methods is the Constant False Alarm Rate (CFAR) algorithms. CFAR determines the threshold value based on the statistical properties of the reference cells located around the target cell and perceives signals above this threshold value as targets. The main advantage of this algorithm is that it can keep the false alarm rate under control. Due to their reliance on predetermined statistical models and susceptibility to environmental changes, traditional approaches like CFAR algorithms frequently struggle with target detection in complex environmental situations. To get over these restrictions, deep learning-based approaches have started to be employed as alternatives to conventional methods. One of the first methods encountered in the literature on target detection with deep learning is CNN. Convolutional Neural Networks (CNN) are capable of learning and identifying characteristics in images. It is anticipated that they have a great deal of potential for radar target detection because of this property. However, CNNs generally focus on pixels in a small area, making it difficult for them to capture connections between larger and more distant areas in the image. As a result, understanding of the overall context is limited. To overcome this issue, transformer-based models such as Vision Transformer (ViT) divide the image into small pieces, analyze them sequentially, and use an attention mechanism to learn the long-distance relationships between these pieces. However, due to the complex structure of ViT, Swin Transformer models appear in the literature as an alternative. Swin Transformer models, which implement an attention mechanism through windowing, are more effective models in terms of complexity. Although Swin Transformer appears to be more efficient in terms of model complexity, the application of an attention mechanism through windowing can cause the model to learn insufficiently and lead to imbalances during training in data where global relationships are important, such as radar data. In addition, since Swin Transformer is a model that performs effectively, especially with large data sets, it may not generalize sufficiently when the data set is insufficient, making it more prone to overfitting. This situation can lead to imbalances during the training process. Since ViT has a more complex structure than the CNN architecture, it requires larger data sets to work with. Although Swin Transformer models are less complex than ViT due to their requirement for larger data sets and lack of data generalization, it is not possible to achieve higher target detection performance with less data. Instead, there is a need for models that can better learn global relationships by considering both the range and Doppler axes in radar data and that have higher generalization capabilities. For this reason, due to insufficient data source, this thesis proposes new radar target detection methods based on an improved ViT architecture. In this study, two different approaches are suggested. First, an improved feedforward network structure is used instead of the Multi-Layer Perceptron (MLP) in standard ViT architectures. This model is called improved ViT. This development aims to increase the learning capacity of the model. It especially aims to improve generalization in complex environments where clutter and noise are intense. Second, a hybrid model is designed by integrating the improved ViT architecture with a CNN in parallel. In hybrid model, the feature maps obtained from the input image are sent to both CNN and improved ViT in parallel. Both structures process features in a way that is specific to their architecture. While CNNs provide superiority in extracting local features from visual data, ViT has the ability to model long time dependencies. A rich representation containing both local and global information is created at the end layer by concatenating the feature maps from the two pathways. The hybrid model created by combining these two models aims to use the strengths of both architectures. Radar data is two-dimensional data consisting of Range and Doppler axis. If these are interpreted as snapshots of the environment, image-based deep learning models such as CNN and ViT can be used for radar data. The proposed approaches are tested on both synthetic and real radar datasets for comparison. The suggested models have been evaluated empirically by contrasting them with CNN-based method and traditional CFAR algorithms such as CA-CFAR, SOCA-CFAR, GOCA-CFAR, and OS-CFAR. The results consistently demonstrate that the hybrid CNN-ViT and improved ViT models perform better than the conventional techniques in terms of detection accuracy, particularly in environments with clutter. This clearly demonstrates that the integration of deep learning architectures into the radar signal processing pipeline leads to better detection performance. This study offers convincing proof that deep learning-based techniques, with their increased flexibility, adaptive learning capabilities, and improved feature representation, can outperform conventional radar detection methods.

Benzer Tezler

  1. Novel approaches to radar signal deinterleaving and geolocation in the framework of optimization and deep learning

    Radar sinyal ayrıştırma ve konum bulma için optimizasyon ve derin öğrenme tabanlı yeni yaklaşımlar

    MUSTAFA ATAHAN NUHOĞLU

    Doktora

    İngilizce

    İngilizce

    2025

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    PROF. DR. HAKAN ALİ ÇIRPAN

  2. Derin öğrenme ile süper çözünürlüklü radar görüntüleme

    Super resolution radar imaging with deep learning

    İREM FADİME ERİM

    Yüksek Lisans

    Türkçe

    Türkçe

    2022

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    Elektronik-Haberleşme Eğitimi Ana Bilim Dalı

    PROF. DR. IŞIN ERER

  3. Improved helicopter classification via deep learning and overlapped range-doppler maps

    Derin öğrenme ve örtüşen menzil-doppler görüntüleri ile geliştirilmiş helikopter sınıflandırması

    DENİZ CAN ACER

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    PROF. DR. IŞIN ERER

  4. Çoklu bant görüntü füzyon yoluyla gelişmiş hedef tespiti ve takibi

    Enhanced target detection and tracking through multiband image fusion

    MERTCAN EVDİ

    Yüksek Lisans

    Türkçe

    Türkçe

    2025

    Elektrik ve Elektronik MühendisliğiAnkara Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    PROF. DR. MURAT EFE

  5. New clutter removal methods for through obstacle target detection

    Engel arkası hedef tespitinde yeni kargaşa giderme yöntemleri

    DENİZ KUMLU

    Doktora

    İngilizce

    İngilizce

    2018

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    DOÇ. DR. IŞIN ERER