Nearest-neighbor based metric functions for indoor scene recognition
İç mekan tanıma için en yakın komşuya dayalı metrik fonksiyonlar
- Tez No: 286309
- Danışmanlar: DOÇ. DR. UĞUR GÜDÜKBAY, PROF. DR. ÖZGÜR ULUSOY
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2011
- Dil: İngilizce
- Üniversite: İhsan Doğramacı Bilkent Üniversitesi
- Enstitü: Mühendislik ve Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Bölümü
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 57
Özet
İç mekan tanıma, insan yapımı yapıların yüksek sınıf içi varyasyonlar ve sınıfarası benzerlikler göstermesi sebebiyle klasik mekan tanıma alanının zorlu birproblemidir. Resmin bütüncül temsillerini çıkarmak gibi en ileri mekan tanımateknikleri iç mekanlarda düşük performans göstermektedirler. Nesnelerin belirlenmesive ardından onların mekanlarla ilişkilendirilmesi gibi ara kademeler kullanandiğer yöntemlerin de oldukça karmaşık bir ortamda nesnelerin başarıyla lokalizeedilmesi ve tanınması handikapları vardır.Kodkitabı olarak da bilinen görsel kelimeler kümesi tekniğinden faydalanaraken yakın komşu yöntemine dayalı bir metrik fonksiyonu ile bu zorluklarınüstesinden gelebilen bir sınıflandırma yöntemi öneriyoruz. Kodkitabı oluşumuöznitelik uzayının mozaikleştirilmesi olarak ele alınırsa, verilen bir resim için,öznitelik vektörlerinin Voronoi hücrelerinin ortalarına olan öğrenilmiş ağırlıklıuzaklıklarının resmin kategorisi için güçlü bir gösterge olduğunu gözlemledik.Yöntemimiz tek bir tanımlayıcı ile bir iç mekan testinde en gelişmiş yaklaşımlarıgeçmekte ve genel bir mekan veri kümesinde rekabetçi sonuçlar üretmektedir.Bu çalışmada her ne kadar temel sorunumuz iç mekan kategorizasyonu olsa da,önerilen metrik fonksiyonunu otomatik etiketleme problemine de bir temel uygulamaoluşturmak için kullanıyoruz. Gittikçe artan sayısal medya ile, otomatik olarak resimlereanlamsal etiketler çıkarma problemine son on yılda araştırmacılar büyük ilgigöstermişlerdir. Bu tarz içerikleri manüel olarak etiketlemek gibi geleneksel yaklaşımlarçok bıktırıcı ve zaman harcayıcı olarak değerlendirilmektedir. Bu neden resimlerianlamsal olarak başarıyla açıklayan anahtar kelimelerle otomatik olarak etiketleme,çözülmeyi bekleyen önemli bir sorundur.
Özet (Çeviri)
Indoor scene recognition is a challenging problem in the classical scene recognitiondomain due to the severe intra-class variations and inter-class similarities ofman-made indoor structures. State-of-the-art scene recognition techniques suchas capturing holistic representations of an image demonstrate low performance onindoor scenes. Other methods that introduce intermediate steps such as identifyingobjects and associating them with scenes have the handicap of successfullylocalizing and recognizing the objects in a highly cluttered and sophisticatedenvironment.We propose a classication method that can handle such diculties of theproblem domain by employing a metric function based on the nearest-neighborclassication procedure using the bag-of-visual words scheme, the so-called codebooks.Considering the codebook construction as a Voronoi tessellation of thefeature space, we have observed that, given an image, a learned weighted distanceof the extracted feature vectors to the center of the Voronoi cells gives a strongindication of the image's category. Our method outperforms state-of-the-art approacheson an indoor scene recognition benchmark and achieves competitiveresults on a general scene dataset, using a single type of descriptor.In this study although our primary focus is indoor scene categorization, we alsoemploy the proposed metric function to create a baseline implementation for theauto-annotation problem. With the growing amount of digital media, the problemof auto-annotating images with semantic labels has received signicant interestfrom researches in the last decade. Traditional approaches where such content ismanually tagged has been found to be too tedious and a time-consuming process.Hence, succesfully labeling images with keywords describing the semantics is acrucial task yet to be accomplished.
Benzer Tezler
- RGB-Dalgılayıcılar kullanılarak eş zamanlı konum belirleme ve haritalama
Simultaneous localization and mapping using RGB-D sensors
OĞUZHAN GÜÇLÜ
Doktora
Türkçe
2018
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHacettepe ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. AHMET BURAK CAN
- Sönümlemeli kanallarda kafes kodlamalı sistemler için birleşik serpiştirme tekniği
Combined interleaving technique for trellis coded systems in feding channels
ERSİN ÖZTÜRK
Yüksek Lisans
Türkçe
1998
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
DOÇ. DR. ÜMİT AYGÖLÜ
- Integrating path planning and image processing with UAVs for disease detection and yield estimation in indoor agriculture
Kapalı alan tarımda hastalık tespiti ve verim tahmini için rota planlama ve görüntü işlemenin İHA'larla entegre edilmesi
ONAT ERDOĞMUŞ
Yüksek Lisans
İngilizce
2024
Mekatronik Mühendisliğiİstanbul Teknik ÜniversitesiMekatronik Mühendisliği Ana Bilim Dalı
PROF. DR. ERDİNÇ ALTUĞ
- Termal görüntülere derin öğrenme tabanlı süper çözünürlük yöntemlerinin uygulanması
Application of deep learning based super resolution in thermal images
CANER CİVE
Yüksek Lisans
Türkçe
2023
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
PROF. DR. ENDER METE EKŞİOĞLU
- Efficient k-nearest neighbor query processing in metric spaces based on precise radius estimation
Metrik uzaylarda iyi bir alan tahmini ile en yakın k komşu sorgusu işleme
CAN ŞARDAN
Yüksek Lisans
İngilizce
2009
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİhsan Doğramacı Bilkent ÜniversitesiBilgisayar Mühendisliği Bölümü
DR. CENGİZ ÇELİK
YRD. DOÇ. DR. ALİ AYDIN SELÇUK