Derin yapay sinir ağlarını kullanarak görüntü başlıkları üretme
Generating image captions using deep neural networks
- Tez No: 892926
- Danışmanlar: PROF. DR. SEVİNÇ İLHAN OMURCA
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2024
- Dil: Türkçe
- Üniversite: Kocaeli Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 45
Özet
İnternette paylaşılan görüntülerin sürekli artışı, otomatik altyazı oluşturma konusunu aktif bir araştırma alanı olarak sürdürmektedir. Bilgisayar görüşü hem de doğal dil işleme tekniklerini kullanarak görüntülere otomatik başlık çıkarma konusu yapay zekanının zorlu bir alanıdır. Derin sinir ağlarının kullanımı, önceki çalışmalarda elde edilen sonuçların üzerine çıkarak daha doğru ve anlamlı altyazılar üretmemize olanak tanır. Bu çalışmada, Flickr8K temel alınarak oluşturulan Türkçe TasvirEt veri seti kullanılmıştır. Görüntülerden özellik çıkarma görevi, VGG-16, InceptionV3, ResNet50 ve DenseNet derin öğrenme modelleri kullanılmıştır. Görüntülere başlık çıkarma görevi ise LSTM derin öğrenme modeli kullanılmıştır. Deneyler sonucunda, veri kümesinin %80'inin eğitim için ayrılmasına ve %20'sinin test için ayrılmasına karar verilmiştir. Çalışmanın deneysel sonuçları derin öğrenme modelinde çıkan değerlerin doğruluğu BLEU skoru ile ölçülmüştür. Görüntülerden özellik çıkarma görevinde VGG-16 mimarisi ile gerçekleştirilen model diğer mimarilerle alınan sonuçlara kıyasla daha yüksek çıkmıştır. Deneysel sonuçlar, bu alanda derin öğrenme modellerinin etkinliğini ve performansını doğrulamaktadır.
Özet (Çeviri)
The continual increase in images shared on the internet perpetuates automatic subtitle generation as an active area of research. The task of automatically generating captions for images using both computer vision and natural language processing techniques remains a challenging domain in artificial intelligence. The use of deep neural networks allows us to surpass the results obtained in previous studies, producing more accurate and meaningful subtitles. In this study, the Turkish TasvirEt dataset, based on Flickr8K, was utilized. The task of feature extraction from images was performed using deep learning models such as VGG-16, InceptionV3, ResNet50, and DenseNet. The caption generation task was accomplished using the LSTM deep learning model. Experiments have led to the decision to allocate 80% of the dataset for training and 20% for testing. The accuracy of the results in the deep learning model was measured using the BLEU score in our study. Among the models used for feature extraction from images, the one implemented with VGG-16 architecture yielded higher results compared to others. Experimental outcomes validate the effectiveness and performance of deep learning models in this field.
Benzer Tezler
- Derin öğrenme tabanlı yöntemlerle düşük ışıklı görüntü iyileştirme
Low light image enhancement with deep learning based methods
EMİN CİHANGİR US
Yüksek Lisans
Türkçe
2024
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
PROF. DR. ENDER METE EKŞİOĞLU
- Türkçe'de varlık ismi tanıma
Named entity recognition in Turkish
ASIM GÜNEŞ
Yüksek Lisans
Türkçe
2018
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. AHMET CÜNEYD TANTUĞ
- Evrişimsel sinir ağlarını kullanarak işaret dili görüntülerinin sınıflandırılması
Image classification for sign language usingconvolutional neural network
KHALED MOHAMED ABUBAKER ELBAYOUDI
Yüksek Lisans
Türkçe
2020
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKastamonu ÜniversitesiMalzeme Bilimi ve Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ÜMİT TOKEŞER
- Design and deployment of deep learning based fuzzy logicsystems
Derin öğrenme tabanlı bulanık sistemlerin geliştirilmesi ve uygulanması
AYKUT BEKE
Doktora
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiKontrol ve Otomasyon Mühendisliği Ana Bilim Dalı
DOÇ. DR. TUFAN KUMBASAR
- Evolutionary feature optimization for plant leaf disease detection by deep neural networks
Bitki yaprak hastalık teşhisi için derin sinir ağları ile evrimsel özellik optimizasyonu
JALAL SADOON HAMEED AL BAYATI
Doktora
İngilizce
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
Prof. Dr. BURAK BERK ÜSTÜNDAĞ