Görsel önem: Modelleme ve görü ve dil uygulamaları
Visual importance: Modeling with applications to vision and language
- Tez No: 444598
- Danışmanlar: YRD. DOÇ. DR. NAZLI İKİZLER CİNBİŞ, YRD. DOÇ. DR. İBRAHİM AYKUT ERDEM
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2016
- Dil: Türkçe
- Üniversite: Hacettepe Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 126
Özet
Bilgisayarlı g¨or¨u basit geometrik s¸ekilleri tanımaktan bir sahnenin b¨ut¨unl¨uk ic¸erisinde anlas¸ılmasına evrilmis¸tir. Bu ilerleme aras¸tırmacıları 10 yıl ¨once c¸alıs¸ılması hayal olan problemleri c¸alıs¸maya itmis¸tir. G¨uncel bir tanesi imgelerin insan diliyle ac¸ıklanabilmesidir. ˙Imgeyi ac¸ıklamak, sahne anlayıs¸ı ve iletis¸im becerileri gerektirdi˘ginden zorlu bir problemdir. Sahne anlayıs¸ında bir zorluk, sahnedeki bahsedilecek unsurların belirlenmesidir. Bu tez, ¨oncelikle g¨orsel ¨onem g¨orsel belirginlik ekseninde de˘gerlendirilecek ve bu imgelerin veri-g¨ud¨uml¨u ac¸ıklanmasında kullanılacaktır. Ardından, bahsedilebilirlik olarak isimlendirdi˘gimiz, ¨o˘grenme-bazlı yeni bir g¨orsel ¨onem y¨otemi gelis¸tirilecek ve bu c¸es¸itli problemlerde test edilecektir. Bahsedilebilirli˘gin algısal g¨or¨u literat¨ur¨uyle kıyası yapılacak ve yenili˘gi g¨osterilecektir. Son olarak, bahsedilebilirli˘gin ¨otesine gec¸erek imgede gerc¸ekten var olan nesnelerin nasıl bulunabilece˘gi g¨osterilecek, ve bu ¨onceden e˘gitilmis¸ bir nesne tanıma algoritmasının performansını arttırmakta kullanılacaktır.
Özet (Çeviri)
Computer vision has matured from detecting simple geometrical shapes to full scene understanding. Such progress motivated the researchers to study new problems. One recent problem is generating automatic, human-like description of the images. This problem offers major challenges for computer vision and natural language processing as image description requires holistic scene understanding and communication skills that mimic humans. A challenge in understanding is to determine which portion of the input is necessary to mention which arises the need for visual importance studies. In this thesis, we first frame visual importance using the notion of visual saliency and apply this to improve transfer-based image description methods. Then, we proceed to define a novel concept we name as mentionness, which aims at scoring image regions according to their importance. We evaluate mentionness on a number of vision to language tasks and show that it performs better than all related perceptual metrics. Finally, we explore how to go beyond mentionness to determine visible objects in the image, which is used to improve the performance of a state-of-the-art object detection algorithm.
Benzer Tezler
- Short term electricity load forecasting with deep learning
Derin öğrenme ile kısa dönemli elektrik yük talep tahmini
İBRAHİM YAZICI
Doktora
İngilizce
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ÖMER FARUK BEYCA
- Multimodal machine comprehension of how-to instructions with images and text
Görüntü ve metin içeren çok kipli nasıl yapılır talimatlarının makine ile kavranması
SEMİH YAĞCIOĞLU
Doktora
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHacettepe ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. MEHMET ERKUT ERDEM
DOÇ. DR. İBRAHİM AYKUT ERDEM
- Procedural approaches in open-world games: Game artists' perspective
Açık dünya oyunlarında prosedürel yaklaşımlar: Oyun sanatçısı perspektifi
CAN ÖZMEN
Yüksek Lisans
İngilizce
2022
Bilim ve Teknolojiİstanbul Teknik ÜniversitesiOyun ve Etkileşim Teknolojileri Ana Bilim Dalı
DOÇ. DR. SEMA ALAÇAM
- Uzaktan algılama verileri kullanarak derin öğrenmeye dayalı arazi kullanımı ve arazi örtüsü haritalama modeli geliştirme
Developing a deep learning-based land use and land cover mapping model using remote sensing data
ŞAZİYE ÖZGE ATİK
Doktora
Türkçe
2021
Jeodezi ve Fotogrametriİstanbul Teknik ÜniversitesiGeomatik Mühendisliği Ana Bilim Dalı
PROF. DR. CENGİZHAN İPBÜKER
- Lifelong learning for auditory scene analysis
İşitsel sahne analizi için hayat boyu öğrenme
BARIŞ BAYRAM
Doktora
İngilizce
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. GÖKHAN İNCE