Derin öğrenme ile 2 boyutlu görüntülerde belirginlik tespiti
Saliency detection with deep learning in 2 dimension images
- Tez No: 947383
- Danışmanlar: DOÇ. DR. NURDAN BAYKAN
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2025
- Dil: Türkçe
- Üniversite: Konya Teknik Üniversitesi
- Enstitü: Lisansüstü Eğitim Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 75
Özet
Görüntü verilerinde nesnelerin tespit edilmesi, teknolojinin gelişmesiyle birlikte önemli bir konu haline gelmiştir. Belirgin nesne tespiti, görüntüdeki en dikkat çekici nesneyi belirlemeyi amaçlamaktadır. Karmaşık arka planlarda, nesnelerin iç içe olduğu durumlarda sınırlarının belirgin bir şekilde tespit edilmesi zorlu bir görevdir. Literatürde; nesnelerin dokuları, parlaklık düzeyleri, renkleri gibi özelliklerine dayanarak belirgin nesneleri tespit eden yöntemler denenmiştir ancak bu yöntemlerdeki özellikler nesneleri genel hatlarıyla sınıflandırsa da karmaşık arka planlı görüntülerde başarılı olamamıştır. Son zamanlarda farklı ön işleme metotları, farklı omurga ağları kullanan yapay sinir ağı mimarileri ile uygulanan yöntemler belirginlik tespitinde yaygın olarak kullanılmaktadır. Ancak nesnelerin genel hatları ve detay özellikleri aynı değildir. Bu sebeple yapay sinir ağı ve dikkat mekanizmalarını birlikte kullanan yöntemler geliştirilmiştir. Son yıllarda doğal dil işleme yöntemlerinden yola çıkarak transformer mimarileri görüntü verilerinde kullanılmaya başlanmıştır. Bu çalışmada, DUTS ve ECSSD veri setleri kullanılarak belirginlik tespiti yapılmıştır. Bunun için öncelikle Evrişimli Sinir Ağı kullanılmıştır. Daha sonra ise transformer kullanılarak belirginlik tespiti yapılmıştır. Transformer mimarilerinin başarımının artması için veri setlerinde öncelikle gürültü ekleme, rotasyon, blur gibi veri ön işleme yöntemleri ile verilerdeki çeşitlilik arttırılmıştır. Böylelikle çalışma kapsamında veri ön işleme metotlarının başarıya etkileri de incelenmiştir. Daha sonra belirginlik tespiti gerçekleştirilirken segmentasyon yöntemi kullanılmıştır. Mekansal dikkat, bir görüntüde hangi bölgelerin daha önemli olduğunu belirleyerek modelin bu alanlara odaklanmasını sağlar. Kanal tabanlı dikkat mekanizması ise her bir özellik haritasının ne kadar önemli olduğunu değerlendirerek modelin daha anlamlı kanallara ağırlık vermesine yardımcı olur. en başarılı sonuçlar DUTS veri kümesinde 0.019 Ortalama Mutlak Hata (OMH), 0.961 Geliştirilmiş Hizalama Ölçütü (GHÖ) ve 0.936 Yapısal Benzerlik Ölçütü (YBÖ) değerleri ile“Segment Anything Model UNet - 2.1”modeli ile elde edilmiştir.
Özet (Çeviri)
The detection of objects in image data has become an important topic with the advancement of technology. Salient object detection aims to identify the most attention-grabbing object in an image. In complex backgrounds or when objects are overlapping, clearly detecting object boundaries becomes a challenging task. In the literature, various methods have been proposed that rely on object features such as texture, brightness levels, and color to detect salient objects. However, while these features can generally classify objects, they have not been successful in images with complex backgrounds. Recently, methods that utilize different preprocessing techniques and neural network architectures with various backbone networks have been widely used in saliency detection. However, objects' overall structure and fine details differ. Therefore, approaches combining neural networks with attention mechanisms have been developed. Inspired by natural language processing, transformer architectures have recently begun to be applied to image data. In this study, saliency detection was performed using the DUTS and ECSSD datasets. First, a Convolutional Neural Network (CNN) was used, followed by a transformer-based saliency detection approach. To enhance the performance of transformer architectures, data augmentation techniques such as noise injection, rotation, and blurring were applied to increase dataset diversity. In this way, the study also investigated the impact of preprocessing methods on model performance. For saliency detection, a segmentation method was used. Spatial attention helps the model focus on important regions in an image by determining which areas are most significant. Channel-wise attention evaluates the importance of each feature map and helps the model focus on more meaningful channels. The best results were obtained on the DUTS dataset using the“Segment Anything Model UNet - 2.1,”achieving 0.019 Mean Absolute Error (MAE), 0.961 Enhanced Alignment Measure (E-measure), and 0.936 Structural Similarity Index (SSIM).
Benzer Tezler
- Developing a smart method for real -time brain tumor localization and segmentation on ct ımages using hybrid techniques and yolo
Hibrit teknikler ve yolo kullanilarak bt görüntülerinde gerçek zamanli beyin tümörü lokalizasyonu ve segmentasyonu için akilli bir yöntem geliştirilmesi
NUSAIBAH KHALID ABDULMAJEED AL-SALIHI
Doktora
İngilizce
2025
Elektrik ve Elektronik MühendisliğiÇukurova ÜniversitesiElektrik ve Elektronik Mühendisliği Ana Bilim Dalı
PROF. DR. ULUS ÇEVİK
PROF. DR. TURGAY İBRİKÇİ
- Diagnosis of alzheimer's disease with deep learning: A hybrid 3D CNN and RNN approach
Derin öğrenme ile alzheımer hastalığının tanısı: Hibrit 3B CNN ve RNN yaklaşımı
IDRIS CHENTOUF
Yüksek Lisans
İngilizce
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBahçeşehir ÜniversitesiYapay Zeka Ana Bilim Dalı
YRD. DOÇ. DR. ZAFER İŞCAN
- İki boyutlu görüntülerde derinlik belirleme yöntemlerindeki zorlukların analizi
Analysis of challenges in determination methods in 2-D images
ZEYNEP AKIN
Yüksek Lisans
Türkçe
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKocaeli ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. AHMET SAYAR
- Denetimsiz derin öğrenme kullanılarak dijital meme tomosentezi görüntülerinde gürültünün giderilmesi
Unsupervised denoising of digital breast tomosynthesis images using deep learning
OSMAN ALPCAN ÖZCAN
Yüksek Lisans
Türkçe
2023
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
DOÇ. DR. İSA YILDIRIM
- A hybrid deep learning metaheuristic model for diagnosis of diabetic retinopathy
Diyabetik retinopatinin tanısı için hibrit bir derin öğrenme meta-sezgisel modeli
ÖMER FARUK GÜRCAN
Doktora
İngilizce
2022
Endüstri ve Endüstri Mühendisliğiİstanbul Teknik ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ÖMER FARUK BEYCA