Geri Dön

Learning visual saliency for static and dynamic scenes

Sabit ve hareketli sahneler için görsel belirginlik öğrenimi

  1. Tez No: 478457
  2. Yazar: YASİN KAVAK
  3. Danışmanlar: YRD. DOÇ. DR. İBRAHİM AYKUT ERDEM, YRD. DOÇ. DR. MEHMET ERKUT ERDEM
  4. Tez Türü: Doktora
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2017
  8. Dil: İngilizce
  9. Üniversite: Hacettepe Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 116

Özet

Görsel belirginliğin nihai hedefi, görüntülerde dikkatimizi çeken bölgelerin tahmin edilmesinde insanların görsel sistemine benzer şekilde çalışabilmektir. Literatürde pek çok farklı model ve öznitelik kullanımı önerilmiş olsa da, farklı özniteliklerin belirginliğe olan bireysel katkılarının bulunabilmesi sorusu hala çözülmemiş anahtar sorulardan bir tanesidir. Bu çalışmada, görsel özniteliklerin birleştirilmesiyle daha etkili belirginlik modelleri kurulabilmesini daha iyi anlamaya çalıştık. Bu amaç kapsamında, farklı makine öğrenimi tekniklerini ve bu tekniklerin sabit ve hareketli sahnelerdeki belirginlik tahmini performanslarını detaylı olarak inceledik. İlk olarak, özniteliklerin orta seviyede birleştirilmesine olanak sağlayan çoklu çekirdek öğrenimi yöntemini sabit belirginlik tahmininde kullandık. İkinci aşamada, dinamik sahnelerde belirginlik tahmini üzerine detaylı bir analiz gerçekleştirdik. Son olarak, sabit parametrelere dayalı olarak birleştirme gerçekleştiren mevcut yöntemlere kıyasla üstün performans sağlayan ve tamamen denetimsiz öğrenim gerçekleştirebilen uyarlanabilir öznitelik birleştirme stratejisini dinamik sahnelerde belirginlik tahmini için önerdik. Literatürdeki mevcut yöntemlerin insanların görsel belirginlik seviyesine göre oldukça geride olduklarını düşünürsek, önerilen yöntemlerimizin bu zorlu problem hakkında yeni öngörüler sağlayacağına inanıyoruz.

Özet (Çeviri)

The ultimate aim in visual saliency estimation is to mimic human visual system in predicting image regions which grab our attention. In the literature, many different features and models have been proposed, but still one of the key questions is how different features contribute to saliency. In this study, we try to get a better understanding of the integration of visual features to build more effective saliency models. Towards this goal, we investigated several machine learning techniques and analyze their saliency estimation performance in static and dynamic scenes. First, multiple kernel learning is employed in static saliency estimation, which provides an intermediate level fusion of features. Second, a thorough analysis is carried out for saliency estimation in dynamic scenes. Lastly, we proposed a fully unsupervised adaptive feature integration scheme for dynamic saliency estimation, which gives superior results compared to the approaches that use fixed set of parameters in fusion stage. Since the existing methods in the literature are far behind in accomplishing human level saliency estimation, we believe that our approaches provide new insights in this challenging problem.

Benzer Tezler

  1. Dynamic fusion networks for predicting saliency in videos

    Videolarda belirginlik tahmini için dinamik tümleştirme ağları

    AYSUN KOÇAK ÖZCAN

    Doktora

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHacettepe Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. MEHMET ERKUT ERDEM

    DOÇ. DR. İBRAHİM AYKUT ERDEM

  2. Deep learning based saliency prediction in videos

    Videolarda derin oğrenme tabanlı belirginlik kestirimi

    ÇAĞDAŞ BAK

    Yüksek Lisans

    İngilizce

    İngilizce

    2016

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHacettepe Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. İBRAHİM AYKUT ERDEM

  3. Attribute based classifiers for image understanding

    Görüntü anlamlandırmak için nitelik tabanlı sınıflandırıcılar

    BERKAN DEMİREL

    Yüksek Lisans

    İngilizce

    İngilizce

    2016

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHacettepe Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. NAZLI İKİZLER CİNBİŞ

    YRD. DOÇ. DR. RAMAZAN GÖKBERK CİNBİŞ

  4. Derin öğrenme ile cerrahi video anlama

    Surgical video understanding with deep learning

    ABDISHAKOUR ABDILLAHI AWALE ABDISHAKOUR ABDILLAHI AWALE

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi Üniversitesi

    Bilişim Sistemleri Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ DUYGU SARIKAYA

  5. Otonom araçlarda fren kararı tahmini için dikkat mekanizması geliştirilmesi

    An attention mechanism for brake decision prediction in autonomous vehicles

    EKREM AKSOY

    Doktora

    Türkçe

    Türkçe

    2020

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolEskişehir Osmangazi Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    DOÇ. DR. AHMET YAZICI