Keyword extraction from speech data using center based clustering
Merkez tabanlı kümeleme kullanarak konuşma verilerinden anahtar kelime çıkartılması
- Tez No: 724298
- Danışmanlar: PROF. DR. YUSUF SİNAN AKGÜL
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2022
- Dil: İngilizce
- Üniversite: Gebze Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 87
Özet
Bu çalışmada doğal dil işlemenin temel konularından olan sesin metne dönüşümü ve metin üzerinden anahtar kelimelerin bulunması üzerine çalışılmıştır. Konuşma tabanlı uygulamalardan alınan ses dosyalarının metne çevrilmesi ve sonrasında elde edilen metinler üzerinden anahtar kelime analizi yapılarak içeriğin otomatik olarak etiketlenmesi amaçlanmıştır. Geliştirilen sistem uçtan uca çevrimiçi olup konuşmadan metne model eğitimi, veri toplanması ve etiketlenmesi, elde edilen metin üzerinden anahtar kelimelerin çıkarılmasını sağlayan modelin ve bu modeli uçtan uca çalıştıran sistemleri kapsamaktadır. Konuşmadan metne çevrimi için, transformer tabanlı özel modeller, önceden eğitilmiş modeller (VOSK, Wav2Vec 2.0), çevrimiçi online model (Google Speech 2 Text) modelleri kullanılmış ve birbirleriyle kıyaslanmıştır. Anahtar kelime çıkarma modeli için, çevrimiçi çalışan ve Türkçe sonuç üretebilen RAKE, YAKE!, TF/IDF modelleri ile kendi geliştirdiğimiz anahtar kelime bulma modeli kıyaslanmış ve sonuçları irdelenmiştir. Bu çalışmanın ana katkıları, kelime içeriğini olduğu gibi kullanmak yerine, kelime köklerinin hesaplanması sonrasında puanlama yapılması, çokça geçen fiillerin ve fiil gruplarının cezalandırılması, birden fazla aday kümede dinamik olarak işlem yapabilmek için yeni bir dinamik küme seçim algoritması kullanılmasıdır. Kullanılan farklı konuşmadan metne model skorlarının anahtar kelime çıkarım modeline etkileri gösterilmiştir. Geliştirdiğimiz anahtar kelime çıkarma modeli düşük skorlu konuşma metinlerinde de diğer yöntemlere göre iyi sonuçlar üretmektedir. Ayrıca, sistemin kıyaslanması için insanlar tarafından etiketlenen bir veri seti oluşturuldu. Sistemin ölçeklenebilir olması için de geliştirilen tüm servisler sanallaştırmaya uygun olarak yazılmış böylece docker üzerinden çalışacak hale gelmiştir.
Özet (Çeviri)
In this work, one of the main subjects of natural language processing, the conversion of speech to text and the extraction of keywords from the text were studied. It is aimed to convert the audio files taken from speech-based applications into text and then automatically label the content by making keyword analysis on the obtained texts. The developed system is online end-to-end and includes speech-to-text model training, data collection and labeling, the model that provides the extraction of keywords from the obtained text, and systems that run this model end-to-end. Transformer-based custom models, pre-trained models (VOSK, Wav2Vec 2.0), online model (Google Speech 2 Text) models were used and compared with each other for speech-to-text conversion. For the keyword extraction model, the RAKE, YAKE!, TF/IDF models that work online and produce Turkish results are compared with the keyword finding model we have developed and the results are examined. The main contributions of this work are, instead of using raw content, use of word roots before calculating any scores, penalization of verbs and verb groups, a naïve dynamic cluster selection algorithm is used to select multiple clusters. The effects of the different speech-to-text model scores used on the keyword extraction model are shown. The keyword extraction model we developed produces better results than other methods in low-score speech texts. Also, a benchmarking dataset was created which was labeled by humans. All services developed for the system to be scalable have been written in accordance with virtualization so that they will run over docker.
Benzer Tezler
- Twitter verisi üzerinde Covid-19'a karşı etkili olan ilaçların doğal dil işleme kullanılarak analizi
Analysis of drugs effective against Covid-19 using natural language processing on Twitter data
ORHAN TALHA KUM
Yüksek Lisans
Türkçe
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Bilimleri Ana Bilim Dalı
DR. ÖĞR. ÜYESİ SEFER BADAY
- Türkçe zamansal ifadelerin etiketlenmesi ve normalleştirilmesi
Başlık çevirisi yok
AYŞENUR GENÇ
Yüksek Lisans
Türkçe
2021
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. AHMET CÜNEYD TANTUĞ
- 2-8 yaş grubu dil gelişimi normal olan çocuklarda Artikülasyon Tarama Ölçeği'nin normalizasyonu
Normalization articulation screening scale in 2-8 age group children with normal language development
MERYEM MUTLU
Yüksek Lisans
Türkçe
2015
Kulak Burun ve BoğazBaşkent ÜniversitesiKulak Burun Boğaz Hastalıkları Ana Bilim Dalı
PROF. DR. EROL BELGİN
- Bilimsel yayınlardan anahtar kelime çıkarımı
Keyword Extraction From Scientific Publications
AHMET SİNA BİRDEVRİM
Yüksek Lisans
Türkçe
2018
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Ticaret ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ALİ BOYACI
- Specific keyword extraction from unstructured curriculum vitae using deep learning methods
Derin öğrenme yöntemleri kullanılarak özgeçmişler üzerinde anahtar kelime çıkarımı
MUSTAFA BUĞRA DÜR
Yüksek Lisans
İngilizce
2021
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolÇankaya ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. HAYRİ SEVER