Geri Dön

Kırgız dili için konuşma tanıma modeli: Araştırma ve geliştirme

Speech recognition model for Kyrgyz language: Research and development

  1. Tez No: 933739
  2. Yazar: MURAT FAZLI
  3. Danışmanlar: DOÇ. DR. BAKIT ŞARŞEMBAYEV
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2025
  8. Dil: Türkçe
  9. Üniversite: Kırgızistan-Türkiye Manas Üniversitesi
  10. Enstitü: Lisansüstü Eğitim Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 65

Özet

Bu tez çalışmasında, az kaynaklı bir dil olan Kırgızca için konuşma tanıma sistemi geliştirilmesi hedeflenmiştir. Çalışma, Common Voice veri seti temel alınarak, wav2vec2-large gibi önceden eğitilmiş derin öğrenme modelleri ile gerçekleştirilmiştir. Modelin eğitimi için veriler dikkatlice işlenmiş, temizlenmiş ve düzenlenmiştir. Bu süreçte, dilin fonetik ve morfolojik özellikleri dikkate alınmıştır. Modelin başarımını değerlendirmek amacıyla kelime hata oranı (WER) ve karakter hata oranı (CER) gibi metrikler kullanılmıştır. Elde edilen sonuçlar, Kırgızca gibi az kaynaklı dillerde konuşma tanıma sistemlerinin uygulanabilirliğini ve etkinliğini ortaya koymuştur. Çalışma sırasında, veri yetersizliği, aksan farklılıkları ve etiketleme süreçlerindeki eksiklikler gibi sınırlamalar detaylı bir şekilde ele alınmıştır. Bu tez, Kırgızca'nın dijital dünyadaki varlığını güçlendirmeye yönelik bir katkı sağlamayı amaçlamaktadır. Ayrıca, kullanılan yöntem ve yaklaşımlar, diğer az kaynaklı dillerde de benzer projelere ilham verebilecek niteliktedir.

Özet (Çeviri)

This thesis explores the development of a speech recognition system for Kyrgyz, a low-resource language. Using the Common Voice dataset as its foundation and employing advanced pre-trained deep learning models like wav2vec2-large, the study undertakes the task of converting Kyrgyz speech into text. The data was rigorously cleaned, processed, and organized to meet the requirements of model training, with a focus on the unique phonetic and morphological aspects of Kyrgyz. The performance of the system was evaluated using metrics such as Word Error Rate (WER) and Character Error Rate (CER). Results highlight the effectiveness and applicability of speech recognition technologies for low-resource languages. Challenges encountered during the study, such as limited data availability, accent variations, and inconsistencies in annotations, are thoroughly analyzed. The primary goal of this thesis is to enhance the digital presence of the Kyrgyz language. Additionally, the methods and strategies implemented in this research provide a foundational approach for future projects aiming to develop speech recognition systems for other low-resource languages.

Benzer Tezler

  1. Kırgız Türkçesi ve Türkiye Türkçesindeki kalıp sözlerin karşılaştırmalı bir incelemesi

    A comparative study of the mold lyrics Kyrgyz Turkish and Turkey in Turkish

    AIDAI KUBANYCHBEKOVA

    Yüksek Lisans

    Türkçe

    Türkçe

    2021

    DilbilimMuğla Sıtkı Koçman Üniversitesi

    Çağdaş Türk Lehçeleri ve Edebiyatları Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ GÜLSİNE UZUN

  2. Кыргыз лирикасы эгемендүүлүк жылдарында: салттуулук жана жаңычылдык маселелери

    Bağımsızlık dönemi Kırgız şiirinde gelenek ve yenilik meseleleri

    KUŞNAZAR KIZI GÜLPERİ

    Yüksek Lisans

    Kırgızca

    Kırgızca

    2020

    Türk Dili ve EdebiyatıKırgızistan-Türkiye Manas Üniversitesi

    Türkoloji Ana Bilim Dalı

    PROF. DR. LAYLİ ÜKÜBAEVA

  3. Zazakî de derheqê awanî û antişî yê karî ser yew cigêrayîş

    Zazaca'da fiil yapı ve çekimi üzerine bir inceleme

    PERİHAN DEMİR

    Yüksek Lisans

    Zazaca

    2015

    DilbilimBingöl Üniversitesi

    Zaza Dili ve Edebiyatı Ana Bilim Dalı

    DOÇ. DR. MUSTAFA KIRKIZ

  4. 'uzak Col' romanı örneğinde 1930'lu yıllarda Kırgız yazı dili üzerine bir inceleme

    A study on the Kyrgyz written language in the 1930s like on the case of the 'uzak col' novel

    HİLMİ GÜLENAY

    Doktora

    Türkçe

    Türkçe

    2024

    DilbilimNiğde Ömer Halisdemir Üniversitesi

    Avrasya Araştırmaları Ana Bilim Dalı

    PROF. DR. HİKMET KORAŞ

  5. Θзбекстандагы жалалкудуктук кыргыздардын элдик оозеки тили магистрдик диссертация

    Özbekistan'daki Calalkuduk Kırgızlarının konuşma dili

    AYNURA ANARBAEVA

    Yüksek Lisans

    Kırgızca

    Kırgızca

    2013

    Türk Dili ve EdebiyatıKırgızistan-Türkiye Manas Üniversitesi

    Türkoloji Ana Bilim Dalı

    PROF. DR. KADIRALI KONKOBAEV