Geri Dön

Görsel önem: Modelleme ve görü ve dil uygulamaları

Visual importance: Modeling with applications to vision and language

  1. Tez No: 444598
  2. Yazar: MERT KILIÇKAYA
  3. Danışmanlar: YRD. DOÇ. DR. NAZLI İKİZLER CİNBİŞ, YRD. DOÇ. DR. İBRAHİM AYKUT ERDEM
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2016
  8. Dil: Türkçe
  9. Üniversite: Hacettepe Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 126

Özet

Bilgisayarlı g¨or¨u basit geometrik s¸ekilleri tanımaktan bir sahnenin b¨ut¨unl¨uk ic¸erisinde anlas¸ılmasına evrilmis¸tir. Bu ilerleme aras¸tırmacıları 10 yıl ¨once c¸alıs¸ılması hayal olan problemleri c¸alıs¸maya itmis¸tir. G¨uncel bir tanesi imgelerin insan diliyle ac¸ıklanabilmesidir. ˙Imgeyi ac¸ıklamak, sahne anlayıs¸ı ve iletis¸im becerileri gerektirdi˘ginden zorlu bir problemdir. Sahne anlayıs¸ında bir zorluk, sahnedeki bahsedilecek unsurların belirlenmesidir. Bu tez, ¨oncelikle g¨orsel ¨onem g¨orsel belirginlik ekseninde de˘gerlendirilecek ve bu imgelerin veri-g¨ud¨uml¨u ac¸ıklanmasında kullanılacaktır. Ardından, bahsedilebilirlik olarak isimlendirdi˘gimiz, ¨o˘grenme-bazlı yeni bir g¨orsel ¨onem y¨otemi gelis¸tirilecek ve bu c¸es¸itli problemlerde test edilecektir. Bahsedilebilirli˘gin algısal g¨or¨u literat¨ur¨uyle kıyası yapılacak ve yenili˘gi g¨osterilecektir. Son olarak, bahsedilebilirli˘gin ¨otesine gec¸erek imgede gerc¸ekten var olan nesnelerin nasıl bulunabilece˘gi g¨osterilecek, ve bu ¨onceden e˘gitilmis¸ bir nesne tanıma algoritmasının performansını arttırmakta kullanılacaktır.

Özet (Çeviri)

Computer vision has matured from detecting simple geometrical shapes to full scene understanding. Such progress motivated the researchers to study new problems. One recent problem is generating automatic, human-like description of the images. This problem offers major challenges for computer vision and natural language processing as image description requires holistic scene understanding and communication skills that mimic humans. A challenge in understanding is to determine which portion of the input is necessary to mention which arises the need for visual importance studies. In this thesis, we first frame visual importance using the notion of visual saliency and apply this to improve transfer-based image description methods. Then, we proceed to define a novel concept we name as mentionness, which aims at scoring image regions according to their importance. We evaluate mentionness on a number of vision to language tasks and show that it performs better than all related perceptual metrics. Finally, we explore how to go beyond mentionness to determine visible objects in the image, which is used to improve the performance of a state-of-the-art object detection algorithm.

Benzer Tezler

  1. Short term electricity load forecasting with deep learning

    Derin öğrenme ile kısa dönemli elektrik yük talep tahmini

    İBRAHİM YAZICI

    Doktora

    İngilizce

    İngilizce

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ÖMER FARUK BEYCA

  2. Multimodal machine comprehension of how-to instructions with images and text

    Görüntü ve metin içeren çok kipli nasıl yapılır talimatlarının makine ile kavranması

    SEMİH YAĞCIOĞLU

    Doktora

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHacettepe Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. MEHMET ERKUT ERDEM

    DOÇ. DR. İBRAHİM AYKUT ERDEM

  3. Procedural approaches in open-world games: Game artists' perspective

    Açık dünya oyunlarında prosedürel yaklaşımlar: Oyun sanatçısı perspektifi

    CAN ÖZMEN

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Bilim ve Teknolojiİstanbul Teknik Üniversitesi

    Oyun ve Etkileşim Teknolojileri Ana Bilim Dalı

    DOÇ. DR. SEMA ALAÇAM

  4. Uzaktan algılama verileri kullanarak derin öğrenmeye dayalı arazi kullanımı ve arazi örtüsü haritalama modeli geliştirme

    Developing a deep learning-based land use and land cover mapping model using remote sensing data

    ŞAZİYE ÖZGE ATİK

    Doktora

    Türkçe

    Türkçe

    2021

    Jeodezi ve Fotogrametriİstanbul Teknik Üniversitesi

    Geomatik Mühendisliği Ana Bilim Dalı

    PROF. DR. CENGİZHAN İPBÜKER

  5. Lifelong learning for auditory scene analysis

    İşitsel sahne analizi için hayat boyu öğrenme

    BARIŞ BAYRAM

    Doktora

    İngilizce

    İngilizce

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. GÖKHAN İNCE