Geri Dön

Keyword extraction from speech data using center based clustering

Merkez tabanlı kümeleme kullanarak konuşma verilerinden anahtar kelime çıkartılması

  1. Tez No: 724298
  2. Yazar: HAKKI YAVUZ ERZURUMLU
  3. Danışmanlar: PROF. DR. YUSUF SİNAN AKGÜL
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2022
  8. Dil: İngilizce
  9. Üniversite: Gebze Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 87

Özet

Bu çalışmada doğal dil işlemenin temel konularından olan sesin metne dönüşümü ve metin üzerinden anahtar kelimelerin bulunması üzerine çalışılmıştır. Konuşma tabanlı uygulamalardan alınan ses dosyalarının metne çevrilmesi ve sonrasında elde edilen metinler üzerinden anahtar kelime analizi yapılarak içeriğin otomatik olarak etiketlenmesi amaçlanmıştır. Geliştirilen sistem uçtan uca çevrimiçi olup konuşmadan metne model eğitimi, veri toplanması ve etiketlenmesi, elde edilen metin üzerinden anahtar kelimelerin çıkarılmasını sağlayan modelin ve bu modeli uçtan uca çalıştıran sistemleri kapsamaktadır. Konuşmadan metne çevrimi için, transformer tabanlı özel modeller, önceden eğitilmiş modeller (VOSK, Wav2Vec 2.0), çevrimiçi online model (Google Speech 2 Text) modelleri kullanılmış ve birbirleriyle kıyaslanmıştır. Anahtar kelime çıkarma modeli için, çevrimiçi çalışan ve Türkçe sonuç üretebilen RAKE, YAKE!, TF/IDF modelleri ile kendi geliştirdiğimiz anahtar kelime bulma modeli kıyaslanmış ve sonuçları irdelenmiştir. Bu çalışmanın ana katkıları, kelime içeriğini olduğu gibi kullanmak yerine, kelime köklerinin hesaplanması sonrasında puanlama yapılması, çokça geçen fiillerin ve fiil gruplarının cezalandırılması, birden fazla aday kümede dinamik olarak işlem yapabilmek için yeni bir dinamik küme seçim algoritması kullanılmasıdır. Kullanılan farklı konuşmadan metne model skorlarının anahtar kelime çıkarım modeline etkileri gösterilmiştir. Geliştirdiğimiz anahtar kelime çıkarma modeli düşük skorlu konuşma metinlerinde de diğer yöntemlere göre iyi sonuçlar üretmektedir. Ayrıca, sistemin kıyaslanması için insanlar tarafından etiketlenen bir veri seti oluşturuldu. Sistemin ölçeklenebilir olması için de geliştirilen tüm servisler sanallaştırmaya uygun olarak yazılmış böylece docker üzerinden çalışacak hale gelmiştir.

Özet (Çeviri)

In this work, one of the main subjects of natural language processing, the conversion of speech to text and the extraction of keywords from the text were studied. It is aimed to convert the audio files taken from speech-based applications into text and then automatically label the content by making keyword analysis on the obtained texts. The developed system is online end-to-end and includes speech-to-text model training, data collection and labeling, the model that provides the extraction of keywords from the obtained text, and systems that run this model end-to-end. Transformer-based custom models, pre-trained models (VOSK, Wav2Vec 2.0), online model (Google Speech 2 Text) models were used and compared with each other for speech-to-text conversion. For the keyword extraction model, the RAKE, YAKE!, TF/IDF models that work online and produce Turkish results are compared with the keyword finding model we have developed and the results are examined. The main contributions of this work are, instead of using raw content, use of word roots before calculating any scores, penalization of verbs and verb groups, a naïve dynamic cluster selection algorithm is used to select multiple clusters. The effects of the different speech-to-text model scores used on the keyword extraction model are shown. The keyword extraction model we developed produces better results than other methods in low-score speech texts. Also, a benchmarking dataset was created which was labeled by humans. All services developed for the system to be scalable have been written in accordance with virtualization so that they will run over docker.

Benzer Tezler

  1. Twitter verisi üzerinde Covid-19'a karşı etkili olan ilaçların doğal dil işleme kullanılarak analizi

    Analysis of drugs effective against Covid-19 using natural language processing on Twitter data

    ORHAN TALHA KUM

    Yüksek Lisans

    Türkçe

    Türkçe

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Bilimleri Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ SEFER BADAY

  2. Türkçe zamansal ifadelerin etiketlenmesi ve normalleştirilmesi

    Başlık çevirisi yok

    AYŞENUR GENÇ

    Yüksek Lisans

    Türkçe

    Türkçe

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. AHMET CÜNEYD TANTUĞ

  3. 2-8 yaş grubu dil gelişimi normal olan çocuklarda Artikülasyon Tarama Ölçeği'nin normalizasyonu

    Normalization articulation screening scale in 2-8 age group children with normal language development

    MERYEM MUTLU

    Yüksek Lisans

    Türkçe

    Türkçe

    2015

    Kulak Burun ve BoğazBaşkent Üniversitesi

    Kulak Burun Boğaz Hastalıkları Ana Bilim Dalı

    PROF. DR. EROL BELGİN

  4. Bilimsel yayınlardan anahtar kelime çıkarımı

    Keyword Extraction From Scientific Publications

    AHMET SİNA BİRDEVRİM

    Yüksek Lisans

    Türkçe

    Türkçe

    2018

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Ticaret Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ALİ BOYACI

  5. Specific keyword extraction from unstructured curriculum vitae using deep learning methods

    Derin öğrenme yöntemleri kullanılarak özgeçmişler üzerinde anahtar kelime çıkarımı

    MUSTAFA BUĞRA DÜR

    Yüksek Lisans

    İngilizce

    İngilizce

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolÇankaya Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. HAYRİ SEVER