Geri Dön

Derin yapay sinir ağlarını kullanarak görüntü başlıkları üretme

Generating image captions using deep neural networks

  1. Tez No: 892926
  2. Yazar: MEHMET ALİ CAN ERTUĞRUL
  3. Danışmanlar: PROF. DR. SEVİNÇ İLHAN OMURCA
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2024
  8. Dil: Türkçe
  9. Üniversite: Kocaeli Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 45

Özet

İnternette paylaşılan görüntülerin sürekli artışı, otomatik altyazı oluşturma konusunu aktif bir araştırma alanı olarak sürdürmektedir. Bilgisayar görüşü hem de doğal dil işleme tekniklerini kullanarak görüntülere otomatik başlık çıkarma konusu yapay zekanının zorlu bir alanıdır. Derin sinir ağlarının kullanımı, önceki çalışmalarda elde edilen sonuçların üzerine çıkarak daha doğru ve anlamlı altyazılar üretmemize olanak tanır. Bu çalışmada, Flickr8K temel alınarak oluşturulan Türkçe TasvirEt veri seti kullanılmıştır. Görüntülerden özellik çıkarma görevi, VGG-16, InceptionV3, ResNet50 ve DenseNet derin öğrenme modelleri kullanılmıştır. Görüntülere başlık çıkarma görevi ise LSTM derin öğrenme modeli kullanılmıştır. Deneyler sonucunda, veri kümesinin %80'inin eğitim için ayrılmasına ve %20'sinin test için ayrılmasına karar verilmiştir. Çalışmanın deneysel sonuçları derin öğrenme modelinde çıkan değerlerin doğruluğu BLEU skoru ile ölçülmüştür. Görüntülerden özellik çıkarma görevinde VGG-16 mimarisi ile gerçekleştirilen model diğer mimarilerle alınan sonuçlara kıyasla daha yüksek çıkmıştır. Deneysel sonuçlar, bu alanda derin öğrenme modellerinin etkinliğini ve performansını doğrulamaktadır.

Özet (Çeviri)

The continual increase in images shared on the internet perpetuates automatic subtitle generation as an active area of research. The task of automatically generating captions for images using both computer vision and natural language processing techniques remains a challenging domain in artificial intelligence. The use of deep neural networks allows us to surpass the results obtained in previous studies, producing more accurate and meaningful subtitles. In this study, the Turkish TasvirEt dataset, based on Flickr8K, was utilized. The task of feature extraction from images was performed using deep learning models such as VGG-16, InceptionV3, ResNet50, and DenseNet. The caption generation task was accomplished using the LSTM deep learning model. Experiments have led to the decision to allocate 80% of the dataset for training and 20% for testing. The accuracy of the results in the deep learning model was measured using the BLEU score in our study. Among the models used for feature extraction from images, the one implemented with VGG-16 architecture yielded higher results compared to others. Experimental outcomes validate the effectiveness and performance of deep learning models in this field.

Benzer Tezler

  1. Derin öğrenme tabanlı yöntemlerle düşük ışıklı görüntü iyileştirme

    Low light image enhancement with deep learning based methods

    EMİN CİHANGİR US

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    PROF. DR. ENDER METE EKŞİOĞLU

  2. Türkçe'de varlık ismi tanıma

    Named entity recognition in Turkish

    ASIM GÜNEŞ

    Yüksek Lisans

    Türkçe

    Türkçe

    2018

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. AHMET CÜNEYD TANTUĞ

  3. Evrişimsel sinir ağlarını kullanarak işaret dili görüntülerinin sınıflandırılması

    Image classification for sign language usingconvolutional neural network

    KHALED MOHAMED ABUBAKER ELBAYOUDI

    Yüksek Lisans

    Türkçe

    Türkçe

    2020

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKastamonu Üniversitesi

    Malzeme Bilimi ve Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ÜMİT TOKEŞER

  4. Design and deployment of deep learning based fuzzy logicsystems

    Derin öğrenme tabanlı bulanık sistemlerin geliştirilmesi ve uygulanması

    AYKUT BEKE

    Doktora

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Kontrol ve Otomasyon Mühendisliği Ana Bilim Dalı

    DOÇ. DR. TUFAN KUMBASAR

  5. Evolutionary feature optimization for plant leaf disease detection by deep neural networks

    Bitki yaprak hastalık teşhisi için derin sinir ağları ile evrimsel özellik optimizasyonu

    JALAL SADOON HAMEED AL BAYATI

    Doktora

    İngilizce

    İngilizce

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    Prof. Dr. BURAK BERK ÜSTÜNDAĞ