Geri Dön

Dayanıklı ses hashleme ile içerik tanılama

Robust audio hashing for content identification

  1. Tez No: 172181
  2. Yazar: OZAN GÜRSOY
  3. Danışmanlar: PROF.DR. BİLGE GÜNSEL
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2006
  8. Dil: Türkçe
  9. Üniversite: İstanbul Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 47

Özet

DAYANIKLI SES HASH'LEME İLE İÇERİK TANILAMA ÖZET Müzik, teknolojik gelişimlerin de etkisiyle, günlük yaşantımızda daha fazla yer almaya başlamıştır. Bu sektörün gelişmesi, gün geçtikçe daha fazla ve çeşitte müzik üretilmesini ve daha çok insanın üretilen müziğe ilgi duymasını sağlamıştır. P2P ağlar, ev bilgisayarı kullanıcılarının amatör, fakat geniş içerikli dijital müzik arşivleri oluşturmalarım sağlamıştır. Televizyonlarda yayınlanan müzik videoları, gördükleri talep sonucunda, müzik yayım yapan kanalların artmasını sağlamıştır. Televizyonun etkisine rağmen, özellikle metropol insanının yollarda harcadığı zaman düşünülürse, radyolar etkilerini yitirmemiş, tersine yayın yapan kanal sayısı artmıştır. Müziğin günümüz insanının yaşamında aldığı rolü farkeden mobil sektör, bu alanda kullanıcılarının ilgisini çekecek yeni servislerle kullanımlarını arttırmayı hedeflemişlerdir. Bu yaygınlaşma, müzik içeriklerinin etiketlenmesi, depolanması ve tanılanması konularında bilimsel ve ticari ilginin artmasıyla sonuçlanmıştır. Bu tez çalışmasında, Phillips Research tarafından tanımlanan“Robust Audio Fingerprinting”yöntemine [1] benzer bir yöntem ile, bilinmeyen bir ses verisini tamlama sistemi gerçeklenmiştir. Ses tanılama sistemi, bilinmeyen bir ses verisinin ayırt edici algısal özelliklerinin bulunup, daha önceden oluşturulmuş bir veri tabanı içinde, model eşleme yöntemine dayalı karşılaştırılması sonucunda, ses verisini tanımlamaya yarayan bilgilerin elde edilmesidir. Günümüzde ses tanılama sistemleri, radyo yayını izleme, mobil uygulamalarla şarkı tanıma, P2P ağlarda yasal olmayan şarkıların filtrelenmesi, telif hakları ve müzik arşivlerinin oluşturulup düzenlenmesi gibi değişik alanlarda kullanılmaktadır. Ses hash'lemesi ile, şarkı ve benzeri ses kayıtlarım benzersiz olarak tamlamaya yarayan ses parmakizlerinin kodlanması sağlanır. Ses tanılama sistemi iki ana bölümden oluşur: ses parmakizleri çıkarma algoritması ve çıkarılan ses parmakizlerinin, çok sayıda şarkıya ait parmakizleri bulunan bir veri tabanında en etkin şekilde aranması. Ses parmakizleri, ses verisinin her 11.6 milisaniyesi için oluşturulan 32 bitlik ses alt- parmakizlerinden (hash değerlerinden) oluşur. Bu, sesin 11.6 milisaniyelik bir çözünürlükle incelendiği anlamına gelir. Alt-parmakizleri zaman ve frekans uzayı boyunca hesaplanan enerji farklarından elde edilir. 256 hash değerinin oluşturduğu dizi bir ses parmakizine karşı düşer. Bu da ses verisinde yaklaşık 3 saniyelik bir bölümdür ve ses verisinin tanılanması için yeterli bilgiyi içerir. Ses parmakizi arama algoritmasının temel hedefi, bir parmakizi bloğunu mümkün olan en etkin şekilde veri tabanındaki parmakizleriyle karşılaştırmaktır. Bire bir eşleşmeden çok en benzeyen ses parmakizlerinin bulunması amaçlandığı için karşılaştırma basit bir işlem değildir. Aranacak ses parmakizleri genelde işlenmiş ya da bozulmuş ses verilerinden çıkarıldığı için bire bir eşleme kullanılamamaktadır. ıxTanıtılan sistem ses verisindeki bozulmam karşı oldukça dayanıklıdır. Ayrıca ses verisini sadece 3 saniyelik bir bölümle tanılama yeteneğine sahiptir. Parmakizlerinin veri tabanında aranmasını hızlandırmak için karşılaştırma sayısını azaltan indeks tablosu hazırlanmıştır. Bundan sonraki araştırmalar, diğer ses parmakizi çıkarma algoritmalarının denenmesine ve bu tezde uygulanan arama algoritmasının daha da iyileştirilmesine odaklanacaktır.

Özet (Çeviri)

ROBUST AUDIO HASHING FOR CONTENT IDENTIFICATION SUMMARY Music started to take part in our daily lives more and more, thanks to technological progress, which provides more and variety music produced as time goes on and more people interest in this music. P2P networks, provide home pc users compose amateur but with large contents digital music archieves. The number of music channels increased, because of the attention for the music videos broadcasted on television. Especially if metropol people who spare too much time on traffic is thought, in spite of the bad effects of TV, radio didn't lose its popularity. On the contrary the number of radio channels incrased. The mobile sector which has comprehended importance of the music for the people's daily lives, aimed to increase the utilization with new services which can draw attention of the users. This widespread came to a conclusion with an increasing scientific and commercial demand for labelling, storage, and identification of the contents of songs. In this thesis studying, by the method which is called“Robust Audio Fingerprinting”by Phillips Research [1], an unknown audio data's identification system is described. Audio identification system uses the distinctive perceptual features of an unknown audio data to retrieve the identifying info of the audio data from an already prepared database of audio fingerprints by comparing based on model pairing. Today audio identification system is used in radio broadcast monitoring, identification songs with mobile utilization, filtering the illegal songs at P2P networks, at copyrights and usage of music database. Audio hashing provides coding audio fingerprint, which is used for identification uniqely a segment of music. An audio fingerprint system basically consists of two parts: a fingerprint extraction algorithm and an algorithm to efficiently search such a fingerprint in a fingerprint database containing the fingerprints of many recordings. Audio fingerprinting extraction is based on extracting bit sequences of 32 bits, so called sub-fingerprints (hash values), for every 1 1.6 ms of audio. This means audio is examined under a solubility with 11.6 ms. These sub-fingerprints are obtained from energy differences along both the time and the frequency axis. A sequence of 256 sub-fingers equals a fingerprint block, which corresponds to 3 seconds of audio, contains enough information to enable reliable identification. The basic aim of the audio fingerprint search algorithm is to compare a fingerprint block with the fingerprints in the database in an efficiently way as possible. It is not an insignificant task, because the matter is not to find an exact copy but the most similar one. This is due to the fact that a fingerprint block that has to be identified is generaly taken from an audio excerpt that has been processed or degraded. The described audio fingerprint extraction algorithm is highly robust against audio signal degradation. Besides it needs only 3 seconds of audio to identify a song. The fingerprint search algorithm is highly efficient and fast. XIFuture research will focus on investigating other fingerprint extraction and optimizing the current fingerprint search algorithm. XII

Benzer Tezler

  1. Audio watermarking, steganalysis using audio quality metrics, and robust audio hashing

    Ses damgalama, ses kalite ölçütleri ile stego-analiz ve dayanıklı algısal kıyım

    HAMZA ÖZER

    Doktora

    İngilizce

    İngilizce

    2005

    Elektrik ve Elektronik MühendisliğiBoğaziçi Üniversitesi

    PROF.DR. BÜLENT SANKUR

    PROF.DR. EMİN ANARIM

  2. Gypsum and gypsum products; production processes and uses of gypsum products

    Alçı ve alçı ürünleri; alçı ürünlerinin üretim teknikleri ve uygulamaları

    HÜSEYİN SAİT SARGIN

    Yüksek Lisans

    İngilizce

    İngilizce

    1996

    İnşaat MühendisliğiOrta Doğu Teknik Üniversitesi

    PROF.DR. ASIM YEĞİNOBALI

  3. İnorganik malzemelerle jeopolimer sentezi ve pomza taşının jeopolimer üzerine etkisinin incelenmesi

    Preparation of geopolymers using inorganic materials and investigation of the effect of the pumice on the geopolymer

    HASAN KURT

    Yüksek Lisans

    Türkçe

    Türkçe

    2016

    Kimya MühendisliğiCumhuriyet Üniversitesi

    Kimya Mühendisliği Ana Bilim Dalı

    PROF. DR. SEVİL ÇETİNKAYA

  4. Perlitli akustik plakların nemli ortamdaki davranışları

    Behaviour of acoustical plates made of expanded perli̇te in moist environment

    SEMİHA YILMAZER

    Doktora

    Türkçe

    Türkçe

    1998

    MimarlıkKaradeniz Teknik Üniversitesi

    Mimarlık Ana Bilim Dalı

    PROF. DR. MESUT B. ÖZDENİZ

  5. Noise robust speech recognition using parallel model compensation and voice activity detection methods

    PMT ve ses aktivitesi tespiti metodları kullanarak gürültüye dayanıklı konuşma tanıma

    SERHAT HIZLISOY

    Yüksek Lisans

    İngilizce

    İngilizce

    2015

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolÇukurova Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ZEKERİYA TÜFEKCİ