Multi-objective evolutionary algorithms for multi-label classification supported by deep auto-encoder on image and video data
Çok etiketli sınıflama ̇için çok amaçlı evrimsel algoritmaların derin otokodlayıcı desteği ̇ile resim ve video verilerine uygulanması
- Tez No: 595946
- Danışmanlar: PROF. DR. MEHMET HALİT SEYFULLAH OĞUZTÜZÜN, PROF. DR. ADNAN YAZICI
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2019
- Dil: İngilizce
- Üniversite: Orta Doğu Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 99
Özet
Bu çalışmada, çoklu etiketlenmiş video ve resim verilerinin, ölçeklenebilir çok amaçlı optimizasyon algoritmaları ile sınıflandırılması amaçlanmıştır. Sınıflandırma algoritmasının güvenirliliği ve veri setinden en az öznitellik seçimi çakışan iki zıt durumdur. Veri setindeki ilgisiz ve fazla özellikler algoritmanın çalışma zamanında ve hatta kesinliğinde olumsuz etkiye sahiptir. Dolayısıyla, öznitelik boyutunun indirgenmesi algoritmanın güvenirliğinin öngörülmesini geliştirirken veri serinin işlenme süresini düşürmek için kilit bir role sahiptir. Bu problem, çok amaçlı evrimsel bir algoritma olan NSGA-II algoritması ve çok etiketli makine öğrenmesi teknikleri kullanılarak çözülmüştür. Genetik algoritma tarafından oluşturulan öznitelik alt kümelerinin başarısının tespitinde İkili Alaka Düzeyi(Binary Relevance), Sınıflandırma Zincirleri(Classifiers Chain), Budanmıs Kümeler(Pruned Sets) ve Rastgele k-etiket Kümesi(Random k-Labelsets) Sınıflandırması gibi çok etiketli sınıflandırma teknikleri kullanılmıştır. Bunun yanı sıra taban algoritma olarak, Destek Vektör Makinesi(Support Vector Machine), J48 Karar Ağacı ve Lojistik Bağlanım algoritmaları kullanılmıştır. Ayrıca, güvenilirliği arttırmak adına derin otokodlayıcı uygulanmış ve hem otokodlayıcıdan hem de genetik algoritmadan elde edilen öznitelik altkümeleri birleştirilip, genetik algoritma üzerinden kollektif öğrenmeye uygulanmıştır. Bu yöntemle aşamalı bir güvenilirlik artışı sağlanmıştır. Bu bağlamda, iki farklı veri seti üzerinden çıkarılan lokal öznitelik belirleyicileri ile kapsamlı deneyler yapılmıştır. Veri setlerinden ilki resimlerden oluşan MIR-Flickr veri seti iken, diğeri bir proje için kayıt altına aldığımız videolar ve özniteliklerini oluşturduğumuz kablosuz çoklu-ortam sensör verisetidir. Genetik algoritma için popülasyon nüfusu ve jenerasyon sayısı gibi değişkenler ayarlandıktan sonra hem algoritmanın doğruluğunu arttırmak hem de çalışma süresini kısaltmak adına algoritmanın paralel versiyonu da uygulanmıştır. Sonuçlar, öznitelik seçimi yapılmamış versiyon ile karşılaştırıldığında; MIR-Flickr veri seti için 0.838 den 0.886 ya yükselmişken, diğer veri seti için 0.694 den 0.845 e kadar geliştirilmiştir. Böylece öznitellik sayısı yüzlerden sadece birkaç seviyesine indirilirken, güvenilirlikten de ödün verilmemistir
Özet (Çeviri)
This study proposes multi-objective scalable algorithms for doing multilabel classification on image/video data. The accuracy of the classification and selection of the minimum number of features are two opposite objectives. The number of irrelevant and/or redundant features will have a negative effect on the computation time and can even degrade the accuracy of the classification. Reducing the dimensionality of features plays a key role in improving the prediction accuracy while reducing processing time of the datasets. In this study, the Multiobjective Non-dominated Sorting Genetic Algorithm (NSGA-II) is improved by multi-label machine learning classification techniques. Subsets of non-dominated features are extracted and validated by multi-label classification techniques, such as binary relevance (BR), classifier chains (CC), pruned sets (PS) and Random k-labelset (RAkEL) classification. Base classifiers, Support Vector Machines (SVM), J48-Decision Tree (J48) and Logistic Regression (LR) are used in the classification phase of the algorithms. Also, for the improvement, an autoencoder is implemented and the features extracted by the autoencoder and the genetic algorithm are merged and ensembled on a genetic algorithm for further optimization. Then, the results of the genetic algorithm are progressively improved. We conduct comprehensive experiments with local feature descriptors extracted from two multi-label data sets, MIR-Flickr which consists of images and the Wireless Multimedia Sensor dataset that we have generated from our video recordings. After tuning for the population size and the number of generations, parallel versions of the algorithms are implemented using to speed up execution of the algorithm while improving the prediction accuracy of the algorithm. The results based on the Hamming score are successfully improved from 0.838 to 0.886 (in the MIR-Flickr dataset) and from 0.694 to 0.845 (in the Wireless Multimedia Sensor-WMS dataset) in terms of Hamming scores against versions of the algorithms using all the features of datasets with no feature selection applied. The number of features is greatly reduced, from a hundred to a few without losing accuracy.
Benzer Tezler
- Geliştirilmiş SPEA2 ile envanter probleminin çözümü
Inventory optimization with a novel SPEA2 algorithm
ALİ BAYRAKDAR
Yüksek Lisans
Türkçe
2020
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Aydın ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. ILHAM HUSEYINOV
- Görüntü sınıflandırması için yapay sinir ağlarının analiz ve optimizasyonu
Analysis and optimization of artificial neural networks for image classification
OZAN ARSLAN
Doktora
Türkçe
2001
Jeodezi ve Fotogrametriİstanbul Teknik ÜniversitesiPROF. DR. OĞUZ MÜFTÜOĞLU
PROF. DR. CANKUT ÖRMECİ
- Understanding shape preferences in architectural design through evolutionary computation
Mimari tasarımdaki şekil tercihlerini evrimsel hesaplama ile anlama
ECENUR YAVUZ
Yüksek Lisans
İngilizce
2020
Bilim ve Teknolojiİstanbul Teknik ÜniversitesiBilişim Ana Bilim Dalı
DR. MICHAEL STEFAN BITTERMANN
- UTADIS based multi-objective evolutionary algorithms for medical diagnosis problems
Tıbbi teşhis problemleri için UTADIS temelli çok amaçlı evrimsel algoritmalar
HALENUR ŞAHİN MAHMUTOĞULLARI
Doktora
İngilizce
2019
Endüstri ve Endüstri MühendisliğiOrta Doğu Teknik ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
PROF. DR. SERHAN DURAN
DOÇ. DR. ERTAN YAKICI
- Heuristic algorithms for solving chemical shift assignment problem in protein structure determination
Sezgisel algoritmalar ile protein yapı belirlemesindeki kimyasal kayma atama probleminin çözümü
EMEL MADEN YILMAZ
Doktora
İngilizce
2021
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. AYŞE ŞİMA UYAR
PROF. DR. PETER GÜNTERT