Nesne tespiti ve görüntü sınıflandırmada derin öğrenme modellerine dayalı yeni yöntemlerin geliştirilmesi
Development of novel deep learning-based methods for object detection and image classification
- Tez No: 965798
- Danışmanlar: PROF. DR. CELAL ÖZTÜRK
- Tez Türü: Doktora
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2025
- Dil: Türkçe
- Üniversite: Erciyes Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 249
Özet
Yapay zeka ve derin öğrenme, görüntü işlemede önemli ilerlemeler sağlamıştır; ancak nesne tespiti ve sınıflandırma süreçleri, veri kalitesi, etiket yetersizliği, verimlilik ve güvenlik sorunlarıyla karşılaşmaktadır. Bu tez, derin transfer öğrenme, aktif öğrenme ve genetik algoritmaları birleştirerek bu sorunlara yönelik dört özgün katkı sunmayı amaçlamaktadır. İlk olarak, el yazısı rakamların tanınması için Faster R-CNN, YOLOv4, YOLOv5 ve DETR mimarileri incelenmiş; önerilen YOLOv5 tabanlı model, hız ve kararlılık açısından en başarılı performansı göstermiştir. İkinci olarak, ev numarası plakalarındaki karakter tanıma problemi için YOLOv5 ve DETR çıktıları, DBSCAN ve K-Means ile birleştirilerek dört hibrit model geliştirilmiş; %99'un üzerinde F1 skorlarıyla karakterlerin okunabilirliği belirgin biçimde artırılmıştır. Üçüncü çalışmada, COVID-19 röntgen görüntülerinin sınıflandırılmasında transfer öğrenme modelleri, k-fold çapraz doğrulama ve genetik algoritma tabanlı optimizasyon uygulanmıştır. genetik algoritma ile optimize edilen ResNet18 modeli, %99,89 AUC ve %99,50 F1 skoru ile en yüksek başarıyı göstermiştir. Model ayrıca farklı veri setleri ve adversarial saldırılar altında test edilmiş; web tabanlı simülasyon arayüzü üzerinden uzaktan tanı ve doktor eğitimine yönelik potansiyel bir sistem olarak ortaya konmuştur. Son olarak, beyin tümörlerinin sınıflandırılmasında transfer öğrenme ile aktif öğrenmeyi bütünleştiren yeni bir çerçeve önerilmiştir. ResNet18 ve genetik algoritmalarla optimize edilen bu yaklaşım, etiketleme maliyetlerini %30 azaltırken %98,75 doğruluk elde etmiş ve geleneksel modellere göre önemli bir iyileşme sağlamıştır. Bu tezde geliştirilen yöntemler, el yazısı tanıma, plaka okuma ve tıbbi görüntü analizinde yüksek doğruluk ve verimlilik sağlayarak gerçek dünya problemlerine uygulanabilir çözümler sunmaktadır.
Özet (Çeviri)
Advances in artificial intelligence have improved image processing; yet, object detection and classification still struggle with data quality, limited labels, and robustness. This dissertation combines transfer learning, active learning, and genetic algorithms to address these challenges through four original contributions. The first study investigated handwritten digit recognition using Faster R-CNN, YOLOv4, YOLOv5, and DETR architectures. The proposed YOLOv5-based model demonstrated superior performance, achieving the best balance of speed and robustness. In the second study, to overcome the limitations of YOLOv5 and DETR in house number recognition, their outputs were combined with DBSCAN and K-Means clustering. This led to four hybrid models, which significantly improved character readability, achieving F1-scores above 99%. The third study focused on COVID-19 X-ray image classification. Transfer learning models with k-fold cross-validation and genetic algorithm (GA)-based hyperparameter optimization were employed. The GA-optimized ResNet18 achieved the highest performance, with 99.89% AUC and 99.50% F1-score. The model was further tested under adversarial images and deployed in a web-based interface, demonstrating potential for remote diagnosis and training. Finally, the fourth study addressed brain tumor classification by integrating transfer learning with active learning. Using ResNet18 optimized with genetic algorithms and a mutual information-based sample selection strategy, the approach reduced labeling costs by 30% while achieving 98.75% accuracy, significantly outperforming conventional transfer learning models. The proposed methods deliver accurate solutions for real-world problems in handwriting recognition, license plate reading, and medical image analysis.
Benzer Tezler
- Yerel görünüm ve derin modeller kullanarak hibrit bir yüz tanıma yaklaşımı
A hybrid face recognition approach using local appearance and deep models
MERT ARI
Yüksek Lisans
Türkçe
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. HAZIM KEMAL EKENEL
- Efficient deep learning approaches for signal and image analysis applications
Sinyal ve görüntü analizi uygulamaları için verimli derin öğrenme yaklaşımları
ONUR CAN KOYUN
Doktora
İngilizce
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Bilimleri Ana Bilim Dalı
PROF. DR. BEHÇET UĞUR TÖREYİN
- Cross-domain one-shot object detection by online fine-tuning
Çevrimiçi ince-ayar ile tek-örnekli çapraz-alan nesne tespiti
İREM BEYZA ONUR
Yüksek Lisans
İngilizce
2024
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
PROF. DR. BİLGE GÜNSEL
- Zeytin hastalıklarının derin öğrenme ile tespiti
Detection of olive fruit diseases with deep learning
ÇAĞLA TOPRAK ERDURAK
Yüksek Lisans
Türkçe
2025
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBandırma Onyedi Eylül ÜniversitesiMekatronik Ana Bilim Dalı
DOÇ. DR. SERHAT KILIÇARSLAN
- Aircraft detection from large scale remote sensing images with deep learning techniques
Büyük ölçekli uzaktan algılama görüntülerinden derin öğrenme teknikleriyle uçak tespiti
MEHMET SOYDAŞ
Yüksek Lisans
İngilizce
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesiİletişim Sistemleri Ana Bilim Dalı
PROF. DR. ELİF SERTEL