Geri Dön

Improving deep neural networks extracting context knowledge from food images

Yemek resimlerinden bağlam bilgisini çıkaran derin sinir ağlarının geliştirilmesi

  1. Tez No: 675274
  2. Yazar: MERVE ELİF ÇELİK
  3. Danışmanlar: DR. ÖĞR. ÜYESİ ÖVGÜ ÖZTÜRK ERGÜN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2021
  8. Dil: İngilizce
  9. Üniversite: Bahçeşehir Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 67

Özet

Literatürde çoklu nesnelerin algılanması ve skorlanması, nesne konumlarını belirleyen bölge öneri ağları algoritmalarıyla gerçekleşmektedir. Ren (2015) makalesindeki gibi RPN'ler, her lokasyonda aynı anda nesne sınırlarını ve onların doğruluk skorlarını tahmin eden tamamen evrişimli ağlardır. Bu skorlama fonksiyonları her bir nesne adayı için olasılık değerlerini vektörel tuttuğundan, Bağlam Bilgisini bu fonksiyona dahil etmek için yeni bir temel skor fonksiyonu ile beraber, nesnelerin birbirine göre korealasyonların oluşacak olan bağıl birlikte bulunma ve bağıl konumları hesaplanacaktır. Buna ek olarak Girshik (2015) ve Redmon (2017) makalelerinde yayınlandığı üzere, Bölge Tabanlı Evrişim Ağlarından (R-CNN) YOLO kullanılarak sınıflandırmada en yüksek hız ile Türk Mutfağı yiyecek sınıflandırması yapılacaktır. Elde edilen malzeme çeşidi olasılık vektörü, merkezi koordinat vektörü ve çerçeve boyutları vektörleri yani Uzamsal bağlam Bilgisi ile her bir yemek çeşidi için ayrı ayrı Atıfsal Tümleçler oluşturulacaktır. Bu tümleçler ile birlikte Tasvirel Bağlam Bilgisi elde edilecek ve Bağlam Bilgisi bununla güçlendirilecektir. Son olarak, malzeme çeşidi olasılık vektörü kullanılarak her bir yemek çeşidi için tek bir ontoloji ağacı hiyerarşik yapısı kurulacaktır. Kurulan bu Gizli Bağlam Bilgisi de derin sinir ağı yapısına eklenerek skor fonksiyonundaki doğru tahmin oranı yükseltilmeye çalışılacaktır.

Özet (Çeviri)

In the literature, detection and scoring of multiple objects are carried out by region suggestion networks algorithms that determine object locations. As in the Ren (2015) article, RPNs are fully convolutional networks that simultaneously estimate object boundaries and their accuracy scores at each location. Since these scoring functions preserve the probability values for each object candidate vector, the relative coexistence and relative positions of objects with respect to each other will be calculated, along with a new base score function to include Context Information to this function. In addition, as published in Girshik (2015) and Redmon (2017) articles, Turkish Cuisine food classification will be made with the highest speed in classification using YOLO from Region-Based Convolution Networks (R-CNN). With the obtained ingredient type probability vector, central coordinate vector, and frame dimensions vectors, namely Spatial Context Information, separate Referring Expressions will be created for each type of food. Descriptive Context Knowledge will be obtained, and Context Knowledge will be strengthened with it. Finally, a single ontology tree hierarchical structure will be established for each type of food image using the ingredient type probability vector. By adding this Hidden Context Information to the Deep Neural Network structure, the correct prediction rate in the score function will be tried to be increased.

Benzer Tezler

  1. Deep learning-based building segmentation using high-resolution aerial images

    Yüksek çözünürlüklü hava görüntüleri kullanarak derin öğrenme temelli bina bölütlemesi

    BATUHAN SARITÜRK

    Doktora

    İngilizce

    İngilizce

    2022

    Jeodezi ve Fotogrametriİstanbul Teknik Üniversitesi

    Geomatik Mühendisliği Ana Bilim Dalı

    PROF. DR. DURSUN ZAFER ŞEKER

  2. Investigation of vision transformers in medical image captioning using deep learning

    Derin öğrenme kullanarak medikal görüntü açıklamada görüntü dönüştürücülerinin incelenmesi

    WISAM RAMADAN

    Yüksek Lisans

    İngilizce

    İngilizce

    2025

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolErciyes Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. BAHRİYE AKAY

  3. Deprem sonrasında binaların hasar tespitinde kullanılan yapay öğrenme algoritmalarının analizi

    Analysis of machine learning algorithms used in post-earthquake building damage assessment

    SERHAT MÜRSEL KÖROĞLU

    Yüksek Lisans

    Türkçe

    Türkçe

    2025

    Jeodezi ve Fotogrametriİstanbul Teknik Üniversitesi

    Bilişim Uygulamaları Ana Bilim Dalı

    DOÇ. DR. CANER GÜNEY

  4. İçerik tabanlı görüntü erişimi ile uzaktan algılama verilerinde obje arama

    Object retrieval in remote sensing data using content based imaged retrieval

    ÖZGE TOKMAK

    Yüksek Lisans

    Türkçe

    Türkçe

    2025

    Jeodezi ve Fotogrametriİstanbul Teknik Üniversitesi

    Geomatik Mühendisliği Ana Bilim Dalı

    PROF. DR. NEBİYE MUSAOĞLU

  5. Türkçe E-ticaret yorumlarının çok etiketli analizi için derin öğrenme modellerinin uygulanması

    Applying deep learning models for multi-label analysis of Turkish E-commerce comments

    ABDULKADİR ŞEN

    Yüksek Lisans

    Türkçe

    Türkçe

    2025

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKonya Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ FATMA ZEHRA SOLAK