İç mekân sahne tanıma için metin tabanlı sınıflandırıcı ve evrişimli sinir ağları kullanarak çok kanallı hibrit model geliştirme
Developing a multi-channel hybrid model for indoor scene recognition using text-based classifiers and convolutional neural networks
- Tez No: 944707
- Danışmanlar: DR. ÖĞR. ÜYESİ TANER UÇKAN
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2025
- Dil: Türkçe
- Üniversite: Van Yüzüncü Yıl Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Yapay Zeka ve Robotik Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 75
Özet
İç mekân sahne tanıma, kapalı alanlardaki farklı ortamları (ofis, kütüphane, mutfak, restoran gibi) tanımlamak için kullanılan bir bilgisayarlı görü problemidir. Robotik, güvenlik, engelli bireylere yardım gibi uygulamalarda mekânı kategorize ederek ortama dair bağlamsal bilgi sağlaması açısından kapsamlı ve güncel bir araştırma alanıdır. Birçok bilgisayarlı görü probleminde olduğu gibi iç mekân sahne tanımada da çoğunlukla evrişimli sinir ağları kullanılmaktadır. Evrişimli sinir ağları (CNN), dış mekân sahne tanımada görselin (örneğin dağ, deniz veya gökyüzünün genel hatları gibi) genel özelliklerine kolayca odaklanarak nispeten daha başarılı iken; iç mekân sahne tanımada görselin yerel özelliklerine (mobilyalar, objeler, çeşitli nesneler gibi ayrıntılara) odaklanmada aynı yüksek başarıyı gösterememektedir.“MIT 67 Indoor Scene”veri setinin kullanıldığı bu çalışmada önerilen iki kanallı hibrit modelde, evrişimli sinir ağları modelinden gelen özellikler ile nesne tanıma kelimeleri kullanılarak geliştirilen metin tabanlı modelden gelen özellikler birleştirilip eğitilmektedir. Doğal dil işleme ve görüntü işleme teknikleri bir arada kullanılarak geliştirilen bu hibrit model ile görüntü işleme modelinin test başarısı %9 arttırılarak yüksek bir başarı oranı elde edilmiştir.
Özet (Çeviri)
Indoor scene recognition is a computer vision problem used to identify different environments in enclosed spaces, such as offices, libraries, kitchens, and restaurants. It is an extensive and evolving research area, particularly in applications such as robotics, security, and assistive technologies for individuals with disabilities, where categorizing spaces provides contextual information about the environment. As in many computer vision problems, convolutional neural networks (CNNs) are predominantly used for indoor scene recognition. While CNNs achieve relatively high success in outdoor scene recognition by focusing on global features of an image (e.g., general outlines of mountains, seas, or skies), they do not perform as effectively in indoor scene recognition, where the emphasis is on local features such as furniture, objects, and various items. In this study, which utilizes the MIT 67 Indoor Scene dataset, a two-channel hybrid model is proposed. The model combines features extracted from a CNN with those obtained from a text-based model developed using object recognition words. By integrating natural language processing (NLP) and image processing techniques, the hybrid model improves the test accuracy of the image processing model by 9%, achieving a high-performance rate.
Benzer Tezler
- Лингво-стилистические особенности ложныхдрузей переводчика
Tuzak kelimelerin çevirisinde dilbilimsel ve üslupbilimselözellikler
ŞUHEDA RENGİN ÖZTÜRK
Yüksek Lisans
Rusça
2024
Mütercim-TercümanlıkKırgızistan-Türkiye Manas ÜniversitesiMütercim Tercümanlık Ana Bilim Dalı
DOÇ. DR. SALTANAT MAMBAYEVA
- Mozart'ın 'Coloratura' kullanımının karakter yaratımındaki rolü -Saraydan kız kaçırma örneği
Mozart's use of coloratura on creating a role –The abduction from the serail example
NAZLI DENİZ SÜREN
Yüksek Lisans
Türkçe
2019
MüzikMimar Sinan Güzel Sanatlar ÜniversitesiSahne Sanatları Ana Sanat Dalı
PROF. ÇİĞDEM İYİCİL
- A multi-instance based learning system for scene recognition
Sahne tanıma problemi̇ i̇çi̇n çoklu örnek tabanlı öğrenme si̇stemi̇
EZGİ EKİZ
Yüksek Lisans
İngilizce
2015
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHacettepe ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. NAZLI İKİZLER CİNBİŞ
- An object recognition framework using contextual interactions among objects
Nesneler arasındaki bağlamsal etkileşimleri kullanan bir nesne tanıma çerçevesi
FIRAT KALAYCILAR
Yüksek Lisans
İngilizce
2009
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİhsan Doğramacı Bilkent ÜniversitesiBilgisayar Mühendisliği Bölümü
YRD. DOÇ. DR. SELİM AKSOY
- Application and analysis of deep learning techniques on the problem of depth estimation from a single image
Derin öğrenme tekniklerinin tekil görüntüden derinlik tahmini problemi üzerinde uygulanması ve incelenmesi
ALİCAN MERTAN
Yüksek Lisans
İngilizce
2020
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. GÖZDE ÜNAL