Improving deep neural networks extracting context knowledge from food images
Yemek resimlerinden bağlam bilgisini çıkaran derin sinir ağlarının geliştirilmesi
- Tez No: 675274
- Danışmanlar: DR. ÖĞR. ÜYESİ ÖVGÜ ÖZTÜRK ERGÜN
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2021
- Dil: İngilizce
- Üniversite: Bahçeşehir Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 67
Özet
Literatürde çoklu nesnelerin algılanması ve skorlanması, nesne konumlarını belirleyen bölge öneri ağları algoritmalarıyla gerçekleşmektedir. Ren (2015) makalesindeki gibi RPN'ler, her lokasyonda aynı anda nesne sınırlarını ve onların doğruluk skorlarını tahmin eden tamamen evrişimli ağlardır. Bu skorlama fonksiyonları her bir nesne adayı için olasılık değerlerini vektörel tuttuğundan, Bağlam Bilgisini bu fonksiyona dahil etmek için yeni bir temel skor fonksiyonu ile beraber, nesnelerin birbirine göre korealasyonların oluşacak olan bağıl birlikte bulunma ve bağıl konumları hesaplanacaktır. Buna ek olarak Girshik (2015) ve Redmon (2017) makalelerinde yayınlandığı üzere, Bölge Tabanlı Evrişim Ağlarından (R-CNN) YOLO kullanılarak sınıflandırmada en yüksek hız ile Türk Mutfağı yiyecek sınıflandırması yapılacaktır. Elde edilen malzeme çeşidi olasılık vektörü, merkezi koordinat vektörü ve çerçeve boyutları vektörleri yani Uzamsal bağlam Bilgisi ile her bir yemek çeşidi için ayrı ayrı Atıfsal Tümleçler oluşturulacaktır. Bu tümleçler ile birlikte Tasvirel Bağlam Bilgisi elde edilecek ve Bağlam Bilgisi bununla güçlendirilecektir. Son olarak, malzeme çeşidi olasılık vektörü kullanılarak her bir yemek çeşidi için tek bir ontoloji ağacı hiyerarşik yapısı kurulacaktır. Kurulan bu Gizli Bağlam Bilgisi de derin sinir ağı yapısına eklenerek skor fonksiyonundaki doğru tahmin oranı yükseltilmeye çalışılacaktır.
Özet (Çeviri)
In the literature, detection and scoring of multiple objects are carried out by region suggestion networks algorithms that determine object locations. As in the Ren (2015) article, RPNs are fully convolutional networks that simultaneously estimate object boundaries and their accuracy scores at each location. Since these scoring functions preserve the probability values for each object candidate vector, the relative coexistence and relative positions of objects with respect to each other will be calculated, along with a new base score function to include Context Information to this function. In addition, as published in Girshik (2015) and Redmon (2017) articles, Turkish Cuisine food classification will be made with the highest speed in classification using YOLO from Region-Based Convolution Networks (R-CNN). With the obtained ingredient type probability vector, central coordinate vector, and frame dimensions vectors, namely Spatial Context Information, separate Referring Expressions will be created for each type of food. Descriptive Context Knowledge will be obtained, and Context Knowledge will be strengthened with it. Finally, a single ontology tree hierarchical structure will be established for each type of food image using the ingredient type probability vector. By adding this Hidden Context Information to the Deep Neural Network structure, the correct prediction rate in the score function will be tried to be increased.
Benzer Tezler
- Deep learning-based building segmentation using high-resolution aerial images
Yüksek çözünürlüklü hava görüntüleri kullanarak derin öğrenme temelli bina bölütlemesi
BATUHAN SARITÜRK
Doktora
İngilizce
2022
Jeodezi ve Fotogrametriİstanbul Teknik ÜniversitesiGeomatik Mühendisliği Ana Bilim Dalı
PROF. DR. DURSUN ZAFER ŞEKER
- Investigation of vision transformers in medical image captioning using deep learning
Derin öğrenme kullanarak medikal görüntü açıklamada görüntü dönüştürücülerinin incelenmesi
WISAM RAMADAN
Yüksek Lisans
İngilizce
2025
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolErciyes ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. BAHRİYE AKAY
- Deprem sonrasında binaların hasar tespitinde kullanılan yapay öğrenme algoritmalarının analizi
Analysis of machine learning algorithms used in post-earthquake building damage assessment
SERHAT MÜRSEL KÖROĞLU
Yüksek Lisans
Türkçe
2025
Jeodezi ve Fotogrametriİstanbul Teknik ÜniversitesiBilişim Uygulamaları Ana Bilim Dalı
DOÇ. DR. CANER GÜNEY
- İçerik tabanlı görüntü erişimi ile uzaktan algılama verilerinde obje arama
Object retrieval in remote sensing data using content based imaged retrieval
ÖZGE TOKMAK
Yüksek Lisans
Türkçe
2025
Jeodezi ve Fotogrametriİstanbul Teknik ÜniversitesiGeomatik Mühendisliği Ana Bilim Dalı
PROF. DR. NEBİYE MUSAOĞLU
- Türkçe E-ticaret yorumlarının çok etiketli analizi için derin öğrenme modellerinin uygulanması
Applying deep learning models for multi-label analysis of Turkish E-commerce comments
ABDULKADİR ŞEN
Yüksek Lisans
Türkçe
2025
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKonya Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ FATMA ZEHRA SOLAK