Geri Dön

Scene classification using spatial pyramid of latent topics

Gizli temalardan uzaysal piramit oluşturularak sahne sınıflandırılması

  1. Tez No: 275514
  2. Yazar: EMRAH ERGÜL
  3. Danışmanlar: YRD. DOÇ. DR. NAFİZ ARICA
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2009
  8. Dil: İngilizce
  9. Üniversite: Deniz Harp Okulu Komutanlığı
  10. Enstitü: Deniz Bilimleri ve Mühendisliği Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 111

Özet

Bu tezde imgelerin analiz edilmesi ve neticesinde içerik bilgilerine göre imgelerin taşıdıkları anlamlara uygun olarak sınıflandırılmaları hedeflenmiştir. İmgenin betimlenmesi sahne sınıflandırma problemindeki en önemli kısmı oluşturmaktadır. Zira literatürdeki mevcut sahne sınıflandırma algoritmaları göz önüne alındığında, bu yöntemlerin çoğunlukla imge betimleme yaklaşımlarındaki farklılıktan ötürü birbirlerinden ayrıştıkları görülmektedir. Bu kapsamda daha etkin bir imge betimlemesi elde etmek ve sınıflandırma performansını arttırmak maksadıyla; zayıf denetimle sahne sınıflandırması sağlayan ve literatürde son zamanlarda sıkça başvurulan Görsel Kelimeler Kümesi ve Olasılıksal Gizli Anlam Analizi yöntemlerinin birleştirildiği iki yeni yaklaşım önerilmektedir.İmgenin betimlenmesi amacıyla ilk yöntem olarak Olasılıksal Gizli Anlam Analizi algoritmasının hiyerarşik bir yapıda imgeye uygulanması önerilmektedir. Yöntemin temelinde SIFT özniteliklerine dayalı Görsel Kelimeler Kümesinin elde edilmesini müteakip, Olasılıksal Gizli Anlam Analizi modellemesinin piramit basamaklandırma şeklinde tüm alt bölgelere ayrı ayrı uygulanması yatmaktadır. Bu düşünceden yola çıkarak, imge alt bölgelere ayrılır ve Olasılıksal Gizli Anlam Analizi alt bölgelere uygulanır. Tüm sevilerden elde edilen gizli tema dağılımı birleştirilerek imge betimlemesi gerçekleştirilir..Önerilen ikinci yöntemde, imge betimlemesi Olasılıksal Gizli Anlam Analiz sonuçlarına göre tema bölütleme esasına dayalıdır. Görsel Kelimeler Kümesi modelinin aksine, imge görsel kelime histogramı yerine tema histogramı kullanılarak betimlenir. Verilen imgedeki her görsel kelime sahip olduğu maksimum tema olasılığına bağlı olarak bir temaya atanır. İlk yöntemde olduğu gibi uzaysal bilginin eklenmesi, imgenin alt bölgelere bölünmesi ve her bölgede tema histogramının elde edilmesiyle sağlanır.Önerilen her iki yöntemin performansı, aynı veri seti kullanılarak eşit şartlarda literatürde mevcut en başarılı diğer yöntemler ile karşılaştırılmış; ve önerilen yöntemlerin diğerlerinde daha iyi neticeler elde ettiği görülmüştür.

Özet (Çeviri)

In this thesis, we aim to classify natural and man-made images among a set of challenging dataset into semantically meaningful categories. It addresses analyzing an image using robust algorithms and assigning it a category label. In this context, image representation is the most important part in the scene classification problem yet scene classification systems in the literature vary mostly based on their representation schemes. We propose two novel approaches of image representation for weakly supervised scene classification that mainly combine two popular methods in the literature: Bag-of-Words (BoW) modeling and probabilistic Latent Semantic Analysis (pLSA) modeling.Firstly, a new image representation scheme based on Cascaded pLSA is proposed. After the BoW representation based on SIFT features is achieved, pLSA analysis is performed in a hierarchical sense. We associate location information with the conventional BoW/pLSA algorithm by subdividing each image into sub-regions iteratively at different resolution levels and implementing a pLSA model for each sub-region individually. Finally, an image is represented by a concatenated topic distributions of each sub-region.In the second method, topic based segmentation is achieved using the results of pLSA analysis. The image is represented with its topic counts, rather than visual word counts used in BoW modeling. We assign each visual word to a topic label which shows maximum posterior probability conditioned on that word of a given image. As in the first method, the spatial information is added to the image representation by subdividing it into finer resolutions, then topic histograms are calculated for each region individually.The performances of our two methods are compared with the most successful methods in the literature using the same dataset and the same number of training and testing images. In the experiments, it is seen that the proposed methods outperform the others in that particular dataset.

Benzer Tezler

  1. İnsansı robotlarda nesne algılama ve tanıma için yeni derin öğrenme algoritmalarının geliştirilmesi

    Development of novel deep learning algorithms for object detection and recognition in humanoid robots

    SİMGE NUR ASLAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2021

    Mekatronik MühendisliğiFırat Üniversitesi

    Mekatronik Mühendisliği Ana Bilim Dalı

    PROF. DR. AYŞEGÜL UÇAR

  2. Color image segmentation: Multithresholding and constraint satisfaction methods

    Renkli imge bölütleme: Çoklueşikleme ve kısıt sağlama metodları

    FATİH KURUGÖLLÜ

    Doktora

    İngilizce

    İngilizce

    2000

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Kontrol ve Otomasyon Mühendisliği Ana Bilim Dalı

    PROF. DR. A. EMRE HARMANCI

  3. Ses olayı tanıma ve akustik sahne geri getirimi

    Sound event recognition and acoustic scenes retrieval

    AHMET MELİH BAŞBUĞ

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBaşkent Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ MUSTAFA SERT

  4. Dalgacık dönüşümü ve yapay sinir ağı kullanarak doku tanıma

    Pattern recognition by using wavelet transform and artificial neural network

    A.SAMET HAŞİLOĞLU

    Doktora

    Türkçe

    Türkçe

    1998

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolMarmara Üniversitesi

    Kontrol ve Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. İHSAN GÖK

  5. Geospatial object recognition using deep networks for satellite images

    Uydu görüntüleri için derin ağlar kullanılarak coğrafi nesnelerin tanımlanması

    ONUR BARUT

    Yüksek Lisans

    İngilizce

    İngilizce

    2018

    Elektrik ve Elektronik MühendisliğiOrta Doğu Teknik Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    PROF. DR. ABDULLAH AYDIN ALATAN