Geri Dön

Ses telleri video görüntülerinden otomatik glottis tespiti

Automatic glottis detection on vocal cord video images

  1. Tez No: 663356
  2. Yazar: AYŞENUR YILMAZ
  3. Danışmanlar: DR. ÖĞR. ÜYESİ TURGAY KOÇ
  4. Tez Türü: Yüksek Lisans
  5. Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2021
  8. Dil: Türkçe
  9. Üniversite: Süleyman Demirel Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 70

Özet

Bu çalışmada ses tellerinin yüksek hızlı görüntülerinden otomatik glottis tespit edilmesi için yeni bir sistem önerilmiştir. Önerilen sistem ses tellerinin açık veya kapalı olmasından bağımsız olarak glottis tespiti gerçekleştirebilmektedir. Geliştirilen sistem piksel tabanlı ve bölge tabanlı olmak üzere iki sınıflandırma modelinin birleşiminden oluşmaktadır. Piksel tabanlı sistem için 3x3 'lük RGB görüntü bileşenlerini öznitelik olarak kullanan Gauss karışım modeli, literatürde bulunan aynı öznitelik setini kullanan çok katmanlı derin yapay sinir ağı modeli referans sistem olarak kabul edilerek sığ bir yapay sinir ağı yapısıyla birlikte karşılaştırılmıştır. Piksel sınıflandırmada performans ölçütleri incelenmiş ve sistemlerin eğitiminde doğruluk ölçütü yerine eşit hata oranı altında en yüksek hassasiyete sahip olan model kullanılarak glottis lokalizasyon performansının arttırılabileceği gösterilmiştir. Önerilen 4096 karışımlı Gauss Karışım modeli piksel sınıflandırmada referans sisteme göre %22, glottis tespitinde ise %12 daha iyi performans göstermiştir. Glottis tespit performansını arttırmak için ikili görüntülerin morfolojik işlemler ve medyan filtreler kullanılarak iyileştirilmesi ve temel sistemde önerilmiş olan eşik değer tabanlı sınıflandırma sistemi yerine glottis bölgesinin yoğunluk ve şekilsel özelliklerini tanımlamak için alan, eksantriklik, oryantasyon, dairesellik ve ortalama yoğunluk değerlerini içeren 5 boyutlu öznitelik vektörü tasarlanmış ardından yapay sinir ağı tabanlı bölge sınıflandırma sistemi oluşturulmuştur. Önerilen sistem IRCAM HSV görüntü veritabanından model eğitimi ve performansının ölçülmesi için 1800 çerçeveden rastgele seçilmiş manuel olarak işaretlenmiş görüntüler %50 eğitim, %25 doğrulama ve %25 değerlendirme olmak üzere gruplandırılmıştır. Her çerçeve için piksel sınıflandırma sonucunda elde edilmiş ikili görüntüler farklı boyutlarda medyan filtre ve morfolojik işlemlerden geçirilmiş ardından her bölge için öznitelikler çıkarılarak sınıflandırma sistemi eğitilmiştir. Geliştirilen sistem medyan filtre ile iyileştirilmiş görüntüler ile birlikte kullanıldığında, ses tellerinin kapalı olması durumunu ihmal eden referans sisteme göre, glottis tespit doğruluğunu 0,21'den 0,76'ya çıkararak önemli bir performans artışı sağlamıştır.

Özet (Çeviri)

In this study, a new system has been proposed for automatic detection of glottis from high speed images of the vocal cords. The proposed system can detect glottis regardless of whether the vocal cords are open or closed. The developed system consists of a combination of two classification models, pixel-based and region-based. For the pixel-based system, the Gaussian mixture model using 3x3 RGB image components as attributes, the multi-layered deep artificial neural network model using the same feature set in the literature was accepted as the reference system and compared with a shallow neural network structure. Performance criteria in pixel classification have been examined and it has been shown that glottis localization performance can be increased by using the model with the highest sensitivity under equal error rate instead of the accuracy criterion in the training of systems. The proposed 4096 Gaussian Mix model performed 22% better than the reference system in pixel classification, 12% better in detecting glottis. In order to increase Glottis detection performance, the enhancement of binary images using morphological processes and median filters and the density and shape features of the glottis region were used instead of the threshold value based classification system proposed in the basic system. In order to define these features, a 5-dimensional feature vector containing area, eccentricity, orientation, circularity and average density values was designed and then an artificial neural network based region classification system was created. In order to measure model training and performance from the proposed system IRCAM HSV image database, randomly selected manually marked images from 1800 frames were grouped as 50% training, 25% verification and 25% evaluation. The binary images obtained as a result of pixel classification for each frame were subjected to different sizes of median filters and morphological processes, then the classification system was trained by extracting the features for each region. When the developed system is used with images enhanced with a median filter, it has increased the glottis detection accuracy from 0.21 to 0.76 compared to the reference system, which neglects the condition of the vocal cords being closed.

Benzer Tezler

  1. Ses teli damar ve şekil özelliklerini değerlendirerek ses telipatolojilerinin sınıflandırılması

    Classification of laryngeal disorders based on shape and vascular patterns of vocal folds

    HAFİZA İREM TÜRKMEN ÇİLİNGİR

    Doktora

    Türkçe

    Türkçe

    2013

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolYıldız Teknik Üniversitesi

    Bilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı

    PROF. DR. MİNE ELİF KARSLIGİL

  2. Ses telleri hastalıklarının sayısal görüntü işleme yöntemleri ile tanılanması

    Diagnosis of vocal cords diseases by using digital image processing methods

    ERKAN ZEKİ ENGİN

    Doktora

    Türkçe

    Türkçe

    2010

    Elektrik ve Elektronik MühendisliğiEge Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. MEHMET ENGİN

  3. Design of a video laryngeal stroboscopy system for studying vocal fold pathology

    Ses telleri patolojilerinin değerlendirilmesi için video laringostroboskopi sistemi tasarımı

    GÖKHAN IŞIK

    Yüksek Lisans

    İngilizce

    İngilizce

    2004

    Tıbbi BiyolojiBoğaziçi Üniversitesi

    Biyomedikal Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ÖZCAN GÜLÇÜR

  4. Statistical QoS assurances for wireless packet data and integration methodologies for 3G/WLAN

    Kablosuz paket verisi için istatistiksel hizmet kalitesi garantisi ve 3G/WLAN sistem bütünleştirme yöntemleri

    FERİT OZAN AKGÜL

    Yüksek Lisans

    İngilizce

    İngilizce

    2004

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKoç Üniversitesi

    Elektrik ve Bilgisayar Mühendisliği Ana Bilim Dalı

    Y.DOÇ.DR. OĞUZ SUNAY

  5. Diyarbakır ilindeki dengbêjlik geleneği ve dengbêjlerin müzikal pratikleri

    The tradition of being a dengbêj and the musical practice of dengbêjs i̇n Diyarbakır provi̇nce

    AHMET ADIGÜZEL

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    Halk Bilimi (Folklor)İnönü Üniversitesi

    Müzik Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ DERYA KARABURUN DOĞAN