Improving deep neural networks extracting context knowledge from food images
Yemek resimlerinden bağlam bilgisini çıkaran derin sinir ağlarının geliştirilmesi
- Tez No: 675274
- Danışmanlar: DR. ÖĞR. ÜYESİ ÖVGÜ ÖZTÜRK ERGÜN
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2021
- Dil: İngilizce
- Üniversite: Bahçeşehir Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 67
Özet
Literatürde çoklu nesnelerin algılanması ve skorlanması, nesne konumlarını belirleyen bölge öneri ağları algoritmalarıyla gerçekleşmektedir. Ren (2015) makalesindeki gibi RPN'ler, her lokasyonda aynı anda nesne sınırlarını ve onların doğruluk skorlarını tahmin eden tamamen evrişimli ağlardır. Bu skorlama fonksiyonları her bir nesne adayı için olasılık değerlerini vektörel tuttuğundan, Bağlam Bilgisini bu fonksiyona dahil etmek için yeni bir temel skor fonksiyonu ile beraber, nesnelerin birbirine göre korealasyonların oluşacak olan bağıl birlikte bulunma ve bağıl konumları hesaplanacaktır. Buna ek olarak Girshik (2015) ve Redmon (2017) makalelerinde yayınlandığı üzere, Bölge Tabanlı Evrişim Ağlarından (R-CNN) YOLO kullanılarak sınıflandırmada en yüksek hız ile Türk Mutfağı yiyecek sınıflandırması yapılacaktır. Elde edilen malzeme çeşidi olasılık vektörü, merkezi koordinat vektörü ve çerçeve boyutları vektörleri yani Uzamsal bağlam Bilgisi ile her bir yemek çeşidi için ayrı ayrı Atıfsal Tümleçler oluşturulacaktır. Bu tümleçler ile birlikte Tasvirel Bağlam Bilgisi elde edilecek ve Bağlam Bilgisi bununla güçlendirilecektir. Son olarak, malzeme çeşidi olasılık vektörü kullanılarak her bir yemek çeşidi için tek bir ontoloji ağacı hiyerarşik yapısı kurulacaktır. Kurulan bu Gizli Bağlam Bilgisi de derin sinir ağı yapısına eklenerek skor fonksiyonundaki doğru tahmin oranı yükseltilmeye çalışılacaktır.
Özet (Çeviri)
In the literature, detection and scoring of multiple objects are carried out by region suggestion networks algorithms that determine object locations. As in the Ren (2015) article, RPNs are fully convolutional networks that simultaneously estimate object boundaries and their accuracy scores at each location. Since these scoring functions preserve the probability values for each object candidate vector, the relative coexistence and relative positions of objects with respect to each other will be calculated, along with a new base score function to include Context Information to this function. In addition, as published in Girshik (2015) and Redmon (2017) articles, Turkish Cuisine food classification will be made with the highest speed in classification using YOLO from Region-Based Convolution Networks (R-CNN). With the obtained ingredient type probability vector, central coordinate vector, and frame dimensions vectors, namely Spatial Context Information, separate Referring Expressions will be created for each type of food. Descriptive Context Knowledge will be obtained, and Context Knowledge will be strengthened with it. Finally, a single ontology tree hierarchical structure will be established for each type of food image using the ingredient type probability vector. By adding this Hidden Context Information to the Deep Neural Network structure, the correct prediction rate in the score function will be tried to be increased.
Benzer Tezler
- Deep learning-based building segmentation using high-resolution aerial images
Yüksek çözünürlüklü hava görüntüleri kullanarak derin öğrenme temelli bina bölütlemesi
BATUHAN SARITÜRK
Doktora
İngilizce
2022
Jeodezi ve Fotogrametriİstanbul Teknik ÜniversitesiGeomatik Mühendisliği Ana Bilim Dalı
PROF. DR. DURSUN ZAFER ŞEKER
- On real-world face super-resolution and face image synthesis evaluation
Gerçek dünya yüz süper çözünürlüğü ve yüz görüntüsü sentezi değerlendirmesi üzerine
ERDİ SARITAŞ
Yüksek Lisans
İngilizce
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. HAZIM KEMAL EKENEL
- Etkin sorgu önerileri için kullanıcı sorgularının görev tabanlı yönetilmesi
Task based management of user queries for effective query suggestions
NURULLAH ATEŞ
Doktora
Türkçe
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. YUSUF YASLAN
- Land cover and land use classification of multi-modal high-resolution satellite images using multi-task deep learning approach
Çok görevli derin öğrenme tekniği ile çok kipli yüksek çözünürlüklü uydu görüntülerinin arazi örtüsü ve arazi kullanımı sınıflandırılması
BURAK EKİM
Yüksek Lisans
İngilizce
2021
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesiİletişim Sistemleri Ana Bilim Dalı
PROF. DR. ELİF SERTEL
- Improving classification of eeg-based motor imagery signals with cross-subject data augmentation and attention-guided multi-domain deep learning
Denekler-arası veri artırımı ve dikkat-odaklı çok alanlı derin öğrenme yoluyla eeg-tabanlı motor imgeleme sinyallerinin sınıflandırılmasının iyileştirilmesi
MUHAMMED ENES ÖZELBAŞ
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolÜsküdar ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. SERHAT ÖZEKES
DR. ÖĞR. ÜYESİ EMİNE ELİF TÜLAY