Geri Dön

Mevkisel ve anlamsal göreceli nitelikler yardımıyla görüntü tanıma

Visual recognition via spatially and semantic relative attributes

  1. Tez No: 421409
  2. Yazar: EMRAH ERGÜL
  3. Danışmanlar: PROF. DR. SARP ERTÜRK, DOÇ. DR. NAFİZ ARICA
  4. Tez Türü: Doktora
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Elektrik ve Elektronik Mühendisliği, Computer Engineering and Computer Science and Control, Electrical and Electronics Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2016
  8. Dil: Türkçe
  9. Üniversite: Kocaeli Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 162

Özet

Bu tezin amacı, görüntü verisinin içeriğine uygun olarak tanımlanmasını sağlayacak yeni bir makine öğrenme algoritması geliştirmektir. Önerilen algoritma; ilk aşamada görüntü tanıma probleminde sıkça kullanılan görsel kelimeler sözlüğünü denetimsiz şekilde elde ederek ham veriyi öncelikle düşük seviye ve boyutta yeni bir öznitelik uzayına taşımak amacıyla derin sinir ağı yapısı kullanmıştır. Auto-Encoder gibi denetimsiz öğrenmeyi sağlayan bir yapay sinir ağı mimarisinde, ara katmanlarda yer alan düğümlere ait ağırlık vektörleri öbekleme algoritması içerisinde prototip vektörlerini temsil etmiştir. Elde edilen prototip vektörleri görsel kelimeler sözlüğünü oluşturmuş ve bir benzerlik metriği kullanılmak suretiyle görüntü verisi düşük seviye ve boyutta öznitelik vektörleri ile ifade edilmiştir. Ayrıca ikinci aşamada, öğrenci-öğretmen etkileşimli bir yapı içerisinde başlangıçta denetimsiz olarak oluşturulan kategori tabanlı göreceli nitelik uzaylarını sınıf modellerine uygun şekilde ve eş zamanlı güncelleyecek özgün bir yöntem geliştirilmiştir. Daha sonra, hedef kategoriler yarı denetimli olarak etkileşimli ve arttırımlı bir yapıda, görsel kelimeler ve göreceli niteliklerle birlikte öğrenilerek görüntü sınıfları modellenmiştir. Tez çalışması neticesinde, bir görüntü içeriğindeki nesne ve nitelikleri dinamik ve çok kriterli ortamda etkin bir şekilde tanıyan sınıflandırma sistemi geliştirilmiştir. Göreceli nitelikler yardımıyla daha geniş bir ifade özgürlüğüne kavuşulacağından, insan-makine etkileşiminde takviyeli öğrenmenin görüntü analizine yansımaları ayrıca değerlendirilmiştir. Görüntü tanımaya/sınıflandırmaya yönelik bulunacak çözüm önerilerinin uygulama sahası olarak yüksek çözünürlüklü uydu görüntülerinin, kızılötesi görüntülerin, medikal görüntülerin, istihbarat maksatlı kullanılan hava araçlarından anlık olarak iletilen görüntülerin ve sualtı ses sinyallerinin analizi kapsamında da kullanılabileceği değerlendirilmektedir.

Özet (Çeviri)

The aim of this thesis is to develop a new machine learning algorithm which leads to the recognition of visual data relevant to the semantic content. The proposed method implements a multi-layer neural network architecture in the first stage to achieve a dictionary of 'Visual Words' in an unsupervised manner which is often used in visual recognition problems. The visual words are used mainly to convey raw visual data into a new feature space that is low level and provides a comperatively reduced representation. The weight vectors which belong to neurons in the hidden layers of a neural netwok alike Auto-Encoder that help unsupervised feature extraction, actually represent prototype vectors for a clustering algorithm. The achieved prototype vectors constitute a dictionary of visual words, and the visual data are represented with low level and reduced feature vectors using a similarity metric. Additionaly in the second step, a new learning method is developed to update category based relative attributes space, initialized with an unsupervised way, according to and concurrent with the class models in a structure of student-teacher interaction. Thereafter, the visual classes are modeled as the target categories are learnt incrementally by means of visual words and relative attributes in a semi-supervised and interactive structure. At the end of this thesis, a visual classification system is developed by means of recognizing the objects and the attributes in its contents effectively at multi-criteria environment. Not only can we analyze the scene/object categories that are included in the training stage, but also new classes which are introduced into the system at the test stage can be recognized by the learnt relative attributes. Additionally, the effects of reinforced learning to the vision processing are evaluated at the human-machine interaction since much more freedom of expression is achieved by means of relative attributes. We think that the proposals for solution of visual recognition/classification problems can indeed be used in the interest areas of high resolution satellite images, infra-red visions, medical images, unmanned aerial vehicle surveilance images and underwater acoustic signal analyzing.

Benzer Tezler

  1. Futbolda en sık uygulanan laktat toparlanma yöntemlerinin mevkilere göre araştırılması

    İnvesti̇gati̇on of the most common aplli̇ed lactate recovery methods accordi̇ng the posi̇ti̇ons i̇n football

    MUSTAFA BOZKURT

    Yüksek Lisans

    Türkçe

    Türkçe

    2018

    FizyolojiGaziantep Üniversitesi

    Fizyoloji Ana Bilim Dalı

    YRD. DOÇ. DAVUT SİNAN KAPLAN

  2. Quadriceps ve hamstring kas kuvveti dinamik denge performansının futbolcularda farklı açısal hızdaki kuvvet değerlerinin mevkisel olarak karşılaştırılması

    Positional comparison of quadriceps and hamstring muscle strength dynamic balance performance in footballers at different angular velocity strength values

    SEBAHATTİN ALTINTAŞ

    Doktora

    Türkçe

    Türkçe

    2024

    SporAtatürk Üniversitesi

    Beden Eğitimi ve Spor Ana Bilim Dalı

    PROF. DR. NECİP FAZIL KİSHALI

  3. Aynı yaş kategorisindeki genç futbolcuların tekrarlı sprint performanslarının mevki ve lig seviyesine göre incelenmesi

    Analysis of repeated sprint performance of young soccer players at the same age category according to game positions and league level

    ONAT ÇETİN

    Yüksek Lisans

    Türkçe

    Türkçe

    2015

    SporGazi Üniversitesi

    Beden Eğitimi ve Spor Ana Bilim Dalı

    YRD. DOÇ. DR. MEHMET KOÇAK

  4. Düzensiz maddelerin elektronik yapılarının yeni bir teknikle hesaplanması

    Calculation of the electronic structure of disordered systems by a new technique

    CENGİZ TATAR

    Doktora

    Türkçe

    Türkçe

    2002

    Fizik ve Fizik MühendisliğiFırat Üniversitesi

    Fizik Ana Bilim Dalı

    DOÇ.DR. ABDÜLKADİR YILDIZ

  5. Bir Türkiye süper lig futbol takımında, COVİD19 pandemisi sebebiyle farklı maç sıklıklarında antrenman yükleri değişimi

    Change in training loads in a Turkish super league football team at different match frequencies due to the COVID19 pandemic

    ÖZDEN ÖNGÜN

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    SporİSTANBUL NİŞANTAŞI ÜNİVERSİTESİ

    Antrenörlük Eğitimi Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ NAHİT BAYLAN