Scene classification using spatial pyramid of latent topics
Gizli temalardan uzaysal piramit oluşturularak sahne sınıflandırılması
- Tez No: 275514
- Danışmanlar: YRD. DOÇ. DR. NAFİZ ARICA
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2009
- Dil: İngilizce
- Üniversite: Deniz Harp Okulu Komutanlığı
- Enstitü: Deniz Bilimleri ve Mühendisliği Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 111
Özet
Bu tezde imgelerin analiz edilmesi ve neticesinde içerik bilgilerine göre imgelerin taşıdıkları anlamlara uygun olarak sınıflandırılmaları hedeflenmiştir. İmgenin betimlenmesi sahne sınıflandırma problemindeki en önemli kısmı oluşturmaktadır. Zira literatürdeki mevcut sahne sınıflandırma algoritmaları göz önüne alındığında, bu yöntemlerin çoğunlukla imge betimleme yaklaşımlarındaki farklılıktan ötürü birbirlerinden ayrıştıkları görülmektedir. Bu kapsamda daha etkin bir imge betimlemesi elde etmek ve sınıflandırma performansını arttırmak maksadıyla; zayıf denetimle sahne sınıflandırması sağlayan ve literatürde son zamanlarda sıkça başvurulan Görsel Kelimeler Kümesi ve Olasılıksal Gizli Anlam Analizi yöntemlerinin birleştirildiği iki yeni yaklaşım önerilmektedir.İmgenin betimlenmesi amacıyla ilk yöntem olarak Olasılıksal Gizli Anlam Analizi algoritmasının hiyerarşik bir yapıda imgeye uygulanması önerilmektedir. Yöntemin temelinde SIFT özniteliklerine dayalı Görsel Kelimeler Kümesinin elde edilmesini müteakip, Olasılıksal Gizli Anlam Analizi modellemesinin piramit basamaklandırma şeklinde tüm alt bölgelere ayrı ayrı uygulanması yatmaktadır. Bu düşünceden yola çıkarak, imge alt bölgelere ayrılır ve Olasılıksal Gizli Anlam Analizi alt bölgelere uygulanır. Tüm sevilerden elde edilen gizli tema dağılımı birleştirilerek imge betimlemesi gerçekleştirilir..Önerilen ikinci yöntemde, imge betimlemesi Olasılıksal Gizli Anlam Analiz sonuçlarına göre tema bölütleme esasına dayalıdır. Görsel Kelimeler Kümesi modelinin aksine, imge görsel kelime histogramı yerine tema histogramı kullanılarak betimlenir. Verilen imgedeki her görsel kelime sahip olduğu maksimum tema olasılığına bağlı olarak bir temaya atanır. İlk yöntemde olduğu gibi uzaysal bilginin eklenmesi, imgenin alt bölgelere bölünmesi ve her bölgede tema histogramının elde edilmesiyle sağlanır.Önerilen her iki yöntemin performansı, aynı veri seti kullanılarak eşit şartlarda literatürde mevcut en başarılı diğer yöntemler ile karşılaştırılmış; ve önerilen yöntemlerin diğerlerinde daha iyi neticeler elde ettiği görülmüştür.
Özet (Çeviri)
In this thesis, we aim to classify natural and man-made images among a set of challenging dataset into semantically meaningful categories. It addresses analyzing an image using robust algorithms and assigning it a category label. In this context, image representation is the most important part in the scene classification problem yet scene classification systems in the literature vary mostly based on their representation schemes. We propose two novel approaches of image representation for weakly supervised scene classification that mainly combine two popular methods in the literature: Bag-of-Words (BoW) modeling and probabilistic Latent Semantic Analysis (pLSA) modeling.Firstly, a new image representation scheme based on Cascaded pLSA is proposed. After the BoW representation based on SIFT features is achieved, pLSA analysis is performed in a hierarchical sense. We associate location information with the conventional BoW/pLSA algorithm by subdividing each image into sub-regions iteratively at different resolution levels and implementing a pLSA model for each sub-region individually. Finally, an image is represented by a concatenated topic distributions of each sub-region.In the second method, topic based segmentation is achieved using the results of pLSA analysis. The image is represented with its topic counts, rather than visual word counts used in BoW modeling. We assign each visual word to a topic label which shows maximum posterior probability conditioned on that word of a given image. As in the first method, the spatial information is added to the image representation by subdividing it into finer resolutions, then topic histograms are calculated for each region individually.The performances of our two methods are compared with the most successful methods in the literature using the same dataset and the same number of training and testing images. In the experiments, it is seen that the proposed methods outperform the others in that particular dataset.
Benzer Tezler
- İnsansı robotlarda nesne algılama ve tanıma için yeni derin öğrenme algoritmalarının geliştirilmesi
Development of novel deep learning algorithms for object detection and recognition in humanoid robots
SİMGE NUR ASLAN
Yüksek Lisans
Türkçe
2021
Mekatronik MühendisliğiFırat ÜniversitesiMekatronik Mühendisliği Ana Bilim Dalı
PROF. DR. AYŞEGÜL UÇAR
- Color image segmentation: Multithresholding and constraint satisfaction methods
Renkli imge bölütleme: Çoklueşikleme ve kısıt sağlama metodları
FATİH KURUGÖLLÜ
Doktora
İngilizce
2000
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiKontrol ve Otomasyon Mühendisliği Ana Bilim Dalı
PROF. DR. A. EMRE HARMANCI
- Ses olayı tanıma ve akustik sahne geri getirimi
Sound event recognition and acoustic scenes retrieval
AHMET MELİH BAŞBUĞ
Yüksek Lisans
Türkçe
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBaşkent ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ MUSTAFA SERT
- Dalgacık dönüşümü ve yapay sinir ağı kullanarak doku tanıma
Pattern recognition by using wavelet transform and artificial neural network
A.SAMET HAŞİLOĞLU
Doktora
Türkçe
1998
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolMarmara ÜniversitesiKontrol ve Bilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. İHSAN GÖK
- Geospatial object recognition using deep networks for satellite images
Uydu görüntüleri için derin ağlar kullanılarak coğrafi nesnelerin tanımlanması
ONUR BARUT
Yüksek Lisans
İngilizce
2018
Elektrik ve Elektronik MühendisliğiOrta Doğu Teknik ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
PROF. DR. ABDULLAH AYDIN ALATAN