Geri Dön

Algısal özet fonksiyonları tabanlı derin öğrenme yöntemleri kullanılarak imgelerin sınıflandırılması

Classification of images by using deep learning methods based on perceptual hash functions

  1. Tez No: 539080
  2. Yazar: FATİH ÖZYURT
  3. Danışmanlar: PROF. DR. ENGİN AVCI
  4. Tez Türü: Doktora
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2019
  8. Dil: Türkçe
  9. Üniversite: Fırat Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Yazılım Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 92

Özet

Endüstri ve akademik çevredeki veri bilimcileri; makine öğrenmesini, imge sınıflandırmasını, video analizini, konuşma tanıma ve doğal dil işleme süreçlerini pek çok alanda kullanmaktadırlar. İmge sınıflandırma aşamasında, özniteliklerin manuel olarak çıkartılması uzmanlık gerektiren bir alandır. Bu nedenle, öznitelik çıkarma aşaması imge sınıflandırılması için örüntü tanımada en önemli adım olarak kabul edilmektedir. Derin öğrenme algoritmaları, imgelerin manuel öznitelik çıkarma özelliğini ortadan kaldırmak için aktif bir araştırma alanı haline gelmiştir. Ancak imgelerde piksel seviyesinde işlem yapılması nedeniyle çalışma zamanını arttırmaktadır. Algısal özet fonksiyonları, imgelerin belirgin özniteliklerini tespit ederek özet değeri oluşturmaktadır. Dolayısıyla algısal özet fonksiyonu ile elde edilen öznitelik verilerine imgenin parmak izi de denilebilir. Bu tez çalışmasında imge yapısını bozmayan algısal özet fonksiyonu kullanılarak direkt ham imgelerden belirgin öznitelikler elde edilmiştir. Seçilen algısal özet fonksiyonunun performansını değerlendirmek için Bit Hata Oranı (BHO), Ortalama Karesel Hata (OKH), Tepe Sinyal Görüntü Oranı (TSGO) gibi parametreler ile karşılaştırılarak başarımları test edilmiştir. Veri tabanı olarak Fırat Üniversitesi hastanesinden alınan karaciğer tümör verileri ve halka açık veri tabanı olan Caltech-101 verileri kullanılmıştır. Derin öğrenme mimarilerinden Evrişimsel Sinir Ağ (ESA) algoritması, Ayrık Dalgacık Dönüşümü (ADD) – Tekil Değer Ayrışımı (TDA) tabanlı algısal özet fonksiyonu ile birlikte kullanılmıştır. Bu doktora tez çalışmasının amacı, algısal özet fonksiyonu tabanlı ESA kullanarak yüksek boyutlu imgelerin sabit diskteki kapladığı boyutu azaltan, sınıflandırma sürelerini kısaltıp sınıflandırma performansını kabul edilebilir bir eşiğin üzerinde tutmaktadır. ADDTDA tabanlı Algısal Özet Fonksiyonu (AÖT) ile ESA birlikte ilk defa kullanılarak özniteliklerin çıkarılması amaçlanmıştır. Karaciğer ve Caltech-101 veri tabanında bulunan çeşitli imgelere uygulanan AÖT-ESA yöntemi ile çıkartılan öznitelikler önerilen yöntemin başarımını test etmek için Yapay Sinir Ağları (YSA), Destek Vektör Makineleri (DVM), Ken Yakın Komşu (KNN) gibi sınıflandırıcılara verilmiştir. AÖT-ESA yöntemi, bir taraftan sınıflandırma performansının gelişimine katkı sunarken diğer taraftan da uzun süren çalışma zamanı probleminin çözümüne katkıda bulunmuştur.

Özet (Çeviri)

Machine learning, image classification, video analysis, speech recognition and natural language processing are widely used by data scientisits in both industrial and academic world for various purposes. The manuel extraction of the features requires a certain expertise during the image classification stage. Thus, the feature extraction phase is considered to be the most important step in pattern recognition for image classification. Deep learning algorithms have become an active research area to remove the manuel feature extraction step of images. However, image processing take considerable long execution times as it operates at the pixel level. The salient characteristics of images are determined by perceptual hash functions which give a certain hash value. Therefore, the feature data obtained by the perceptual hash function can also be called the fingerprint of the image. In this thesis, salient features are obtained directly from raw images by using perceptual hash function which does not distort image structure. Comparisons have been made by considering some parameters as BER, MSE, PSNR to evaluate the performance of the proposed perceptual hash function. Liver disease images obtained from Elazig University Hospital Radiology Laboratory, and Caltech-101 (publicly available database) images were used as a database. The Convolutional Neural Network (CNN) algorithm, one of the deep learning architectures, was used with the Discrete Wavelet Transform (DWT) - Singular Value Decomposition (SVD) based perceptual hash function. The aim of this doctorate thesis is to reduce the classification time of the high-dimensional images and their sizes on hard disk while maintaining the classification performance above an acceptable threshold by using perceptual hash based CNN. It is intended to extract the features by using both DWT - SVD based perceptual hash function and the CNN for the first time together. The results obtained by applying the our proposed method to the liver and the Caltech-101 image database were evaluated by considering some known classifiers such as Artificial Neural Networks (ANN), Support Vector Machines (SVM), K-nearest Neighbor (KNN). The proposed method not only improves the classification performance but also provides a positive impact on the excessive runtime problem.

Benzer Tezler

  1. Three dimensional transform based robust video hashing

    Üç boyutlu dönüşüm tabanlı dayanıklı video kıyımı

    BARIŞ COŞKUN

    Yüksek Lisans

    İngilizce

    İngilizce

    2004

    Elektrik ve Elektronik MühendisliğiBoğaziçi Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    PROF. DR. MEHMET BÜLENT SANKUR

  2. Audio watermarking, steganalysis using audio quality metrics, and robust audio hashing

    Ses damgalama, ses kalite ölçütleri ile stego-analiz ve dayanıklı algısal kıyım

    HAMZA ÖZER

    Doktora

    İngilizce

    İngilizce

    2005

    Elektrik ve Elektronik MühendisliğiBoğaziçi Üniversitesi

    PROF.DR. BÜLENT SANKUR

    PROF.DR. EMİN ANARIM

  3. Hemiplejik hastalarda üst ekstremite fonksiyonlarındaki geri dönüşü etkileyen faktörler

    The effective factors to the recovery of upper extremity functions in hemiplegic patients

    BİRGÜL DÖNMEZ

    Yüksek Lisans

    Türkçe

    Türkçe

    2003

    Fiziksel Tıp ve RehabilitasyonDokuz Eylül Üniversitesi

    Fizik Tedavi ve Rehabilitasyon Ana Bilim Dalı

    YRD. DOÇ. DR. SALİH ANGIN

  4. Çocuk hastanelerinde hasta çocuk yatak odalarının tüm gereksinimlere uygun iç mekan biçimlenmesi

    The Formation of interior space according to all necessities in the patient children bedrooms in the children hospital

    MUNA SİLAV

    Yüksek Lisans

    Türkçe

    Türkçe

    1998

    İç Mimari ve DekorasyonHacettepe Üniversitesi

    İç Mimarlık ve Çevre Tasarımı Ana Bilim Dalı

    PROF. DR. AYHAN AZZEM AYDINÖZ

  5. Hastanelerdeki hasta odalarının tedavi gören çocuklar üzerindeki etkileri

    Effects of patient rooms in hospitals on sick children who are treated

    EYLEM KÖSE

    Yüksek Lisans

    Türkçe

    Türkçe

    2003

    MimarlıkYıldız Teknik Üniversitesi

    Mimarlık Ana Bilim Dalı

    DOÇ. DR. SEDA TÖNÜK