Kırgız dili için konuşma tanıma modeli: Araştırma ve geliştirme
Speech recognition model for Kyrgyz language: Research and development
- Tez No: 933739
- Danışmanlar: DOÇ. DR. BAKIT ŞARŞEMBAYEV
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2025
- Dil: Türkçe
- Üniversite: Kırgızistan-Türkiye Manas Üniversitesi
- Enstitü: Lisansüstü Eğitim Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 65
Özet
Bu tez çalışmasında, az kaynaklı bir dil olan Kırgızca için konuşma tanıma sistemi geliştirilmesi hedeflenmiştir. Çalışma, Common Voice veri seti temel alınarak, wav2vec2-large gibi önceden eğitilmiş derin öğrenme modelleri ile gerçekleştirilmiştir. Modelin eğitimi için veriler dikkatlice işlenmiş, temizlenmiş ve düzenlenmiştir. Bu süreçte, dilin fonetik ve morfolojik özellikleri dikkate alınmıştır. Modelin başarımını değerlendirmek amacıyla kelime hata oranı (WER) ve karakter hata oranı (CER) gibi metrikler kullanılmıştır. Elde edilen sonuçlar, Kırgızca gibi az kaynaklı dillerde konuşma tanıma sistemlerinin uygulanabilirliğini ve etkinliğini ortaya koymuştur. Çalışma sırasında, veri yetersizliği, aksan farklılıkları ve etiketleme süreçlerindeki eksiklikler gibi sınırlamalar detaylı bir şekilde ele alınmıştır. Bu tez, Kırgızca'nın dijital dünyadaki varlığını güçlendirmeye yönelik bir katkı sağlamayı amaçlamaktadır. Ayrıca, kullanılan yöntem ve yaklaşımlar, diğer az kaynaklı dillerde de benzer projelere ilham verebilecek niteliktedir.
Özet (Çeviri)
This thesis explores the development of a speech recognition system for Kyrgyz, a low-resource language. Using the Common Voice dataset as its foundation and employing advanced pre-trained deep learning models like wav2vec2-large, the study undertakes the task of converting Kyrgyz speech into text. The data was rigorously cleaned, processed, and organized to meet the requirements of model training, with a focus on the unique phonetic and morphological aspects of Kyrgyz. The performance of the system was evaluated using metrics such as Word Error Rate (WER) and Character Error Rate (CER). Results highlight the effectiveness and applicability of speech recognition technologies for low-resource languages. Challenges encountered during the study, such as limited data availability, accent variations, and inconsistencies in annotations, are thoroughly analyzed. The primary goal of this thesis is to enhance the digital presence of the Kyrgyz language. Additionally, the methods and strategies implemented in this research provide a foundational approach for future projects aiming to develop speech recognition systems for other low-resource languages.
Benzer Tezler
- Kırgız Türkçesi ve Türkiye Türkçesindeki kalıp sözlerin karşılaştırmalı bir incelemesi
A comparative study of the mold lyrics Kyrgyz Turkish and Turkey in Turkish
AIDAI KUBANYCHBEKOVA
Yüksek Lisans
Türkçe
2021
DilbilimMuğla Sıtkı Koçman ÜniversitesiÇağdaş Türk Lehçeleri ve Edebiyatları Ana Bilim Dalı
DR. ÖĞR. ÜYESİ GÜLSİNE UZUN
- Кыргыз лирикасы эгемендүүлүк жылдарында: салттуулук жана жаңычылдык маселелери
Bağımsızlık dönemi Kırgız şiirinde gelenek ve yenilik meseleleri
KUŞNAZAR KIZI GÜLPERİ
Yüksek Lisans
Kırgızca
2020
Türk Dili ve EdebiyatıKırgızistan-Türkiye Manas ÜniversitesiTürkoloji Ana Bilim Dalı
PROF. DR. LAYLİ ÜKÜBAEVA
- Zazakî de derheqê awanî û antişî yê karî ser yew cigêrayîş
Zazaca'da fiil yapı ve çekimi üzerine bir inceleme
PERİHAN DEMİR
Yüksek Lisans
Zazaca
2015
DilbilimBingöl ÜniversitesiZaza Dili ve Edebiyatı Ana Bilim Dalı
DOÇ. DR. MUSTAFA KIRKIZ
- 'uzak Col' romanı örneğinde 1930'lu yıllarda Kırgız yazı dili üzerine bir inceleme
A study on the Kyrgyz written language in the 1930s like on the case of the 'uzak col' novel
HİLMİ GÜLENAY
Doktora
Türkçe
2024
DilbilimNiğde Ömer Halisdemir ÜniversitesiAvrasya Araştırmaları Ana Bilim Dalı
PROF. DR. HİKMET KORAŞ
- Θзбекстандагы жалалкудуктук кыргыздардын элдик оозеки тили магистрдик диссертация
Özbekistan'daki Calalkuduk Kırgızlarının konuşma dili
AYNURA ANARBAEVA
Yüksek Lisans
Kırgızca
2013
Türk Dili ve EdebiyatıKırgızistan-Türkiye Manas ÜniversitesiTürkoloji Ana Bilim Dalı
PROF. DR. KADIRALI KONKOBAEV