Türkiye'de konuşulan dillerin derin öğrenme yöntemleriyle sınıflandırılması
Classification of languages spoken in Türki̇ye using deep learning methods
- Tez No: 956982
- Danışmanlar: PROF. DR. HAMİT ERDEM
- Tez Türü: Yüksek Lisans
- Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2025
- Dil: Türkçe
- Üniversite: Başkent Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Elektrik Elektronik Mühendisliği Bilim Dalı
- Sayfa Sayısı: 78
Özet
Günümüzde konuşan dil tanıma sistemleri; insan-makine etkileşimi, robotik uygulamalar, çok dilli iletişim ve güvenlik gibi çeşitli alanlarda yaygın olarak kullanılmaktadır. Bu sistemler, otonom robotik etkileşim, çok dilli müşteri hizmetleri ve otomatik çeviri gibi uygulamalarda etkin rol oynamaktadır. Ayrıca, güvenlik ve adli bilişimde anonim ses kayıtlarının dilini belirlemek; göçmen profilleme ve istihbarat analizleri açısından önem taşımaktadır. Bu tez çalışmasında, Türkiye'de yaygın olarak konuşulan diller olarak, Türkiye'ye yerleşen ve Türkiye'yi sıkça ziyaret eden yabancı uyruklu bireylerin konuştukları diller esas alınarak bir veri seti oluşturulmuştur. Bu kapsamda hazırlanan veri setinde; Türkçe, Kürtçe, Arapça, Rusça, Farsça ve Almanca dillerine ait ses kayıtları yer almaktadır. Konuşulan dili otomatik olarak tanıma problemi, bir sınıflandırma problemi olarak ele alınmıştır. Bu problemi çözmek amacıyla farklı derin öğrenme mimarileri kullanılmıştır. İlk olarak, spektral özelliklerin zamansal örüntülerini yakalamada etkili olan İki Yönlü Uzun Kısa Süreli Bellek (BiLSTM) ağları uygulanmıştır. Ayrıca, mekânsal örüntüleri çıkarmada başarılı olan Evrişimsel Sinir Ağları (CNN) ile birlikte, dil tanıma problemlerinde son yıllarda dikkat çekici başarılar gösteren Transformer tabanlı Encoder mimarisi de değerlendirilmiştir. Bunun yanı sıra, CNN ve self-attention mekanizmalarını aynı yapıda birleştirerek hem yerel hem de küresel bağlamı yakalayabilen Conformer Encoder mimarisi de çalışmada uygulanmış ve karşılaştırmalı analiz yapılmıştır. Modelin performansını değerlendirmek amacıyla doğruluk (accuracy), duyarlılık (sensitivity/recall) ve diğer ilgili performans metrikleri kullanılmıştır.
Özet (Çeviri)
Today, spoken language identification systems are widely used in various domains such as human-machine interaction, robotics, multilingual communication, and security. These systems play an important role in applications like autonomous robotic interaction, multilingual customer services, and automatic translation. Moreover, identifying the language of anonymous voice recordings has become increasingly significant in fields such as security, forensic informatics, immigration profiling, and intelligence analysis. In this thesis, a dataset was created based on the languages commonly spoken in Türkiye, including those spoken by foreign nationals who have settled in or frequently visit the country. The dataset includes voice recordings in Turkish, Kurdish, Arabic, Russian, Persian, and German. The task of automatically recognizing the spoken language is addressed as a classification problem. To solve this problem, various deep learning architectures were implemented. First, Bidirectional Long Short-Term Memory networks were used due to their effectiveness in capturing the temporal patterns of spectral features. Additionally, Convolutional Neural Networks, which are successful in extracting spatial patterns, and Transformer-based encoder architectures, which have shown remarkable performance in recent language recognition tasks, were also evaluated. Furthermore, the Conformer encoder architecture, which combines CNN and self-attention mechanisms to capture both local and global contexts simultaneously, was applied and compared with other models. To evaluate model performance, accuracy, recall (sensitivity), and other relevant performance metrics were utilized.
Benzer Tezler
- Билим, илим жана маданият тармагындагы Кыргызстан менен Түркиянын кызматташтыгы (1992-2012 жж.)
Kırgız Cumhuriyeti ile Türkiye Cumhuriyeti arasında eğitim, bilim ve kültürel ilişkiler (1992-2012)
KADRİ AĞGÜN
Doktora
Kırgızca
2016
TarihKyrgyz State University named after I ArabaevTarih Ana Bilim Dalı
PROF. DR. TÖLÖBEK ABDRAHMANOV
- Probleme bei der didaktik der berufssprache Deutsch im Türkischen hochschulwesen und alternative lösungsvorschläge in bezug auf die akademische ausbildung
Türkiye'de yükseköğretim bünyesinde sunulan mesleki uzmanlık dili olarak Almanca dersinde yaşanan aksaklıklar ve akademik öğreti açısından ön görülen alternatif çözüm yolları
SELAHADDİN SOYUDOĞRU
Yüksek Lisans
Almanca
2019
Eğitim ve ÖğretimÇukurova ÜniversitesiAlman Dili Eğitimi Ana Bilim Dalı
DOÇ. DR. YASEMİN DARANCIK
- Erste fremdsprachenwahl in der fremdsprachendidaktik im primᾱr- und sekundᾱrbereich: Zu wahlkriterien aus pᾱdagogischer und struktureller perspektive
İlk ve orta öğretim yabancı dil eğitiminde birinci yabancı dil seçimi: Pedagojik ve yapısal açıdan tercih ölçütleri üzerine
AİŞE SEZİK
Yüksek Lisans
Almanca
2015
Eğitim ve ÖğretimÇukurova ÜniversitesiAlman Dili Eğitimi Ana Bilim Dalı
PROF. DR. ERGÜN SERİNDAĞ
- Ordu ili (Türkiye) tatlısu Gammaridea (Crustacea, Amphipoda) faunası üzerine bir araştırma
Study on freshwater Gammari̇dea (Crustacea, Amphipoda) fauna of Ordu (Turkey)
MEHMET EKİNCİ
Yüksek Lisans
Türkçe
2015
Balıkçılık TeknolojisiOrdu ÜniversitesiBalıkçılık Teknolojisi Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. ALİ MİROĞLU
- Karanlıkdere Vadisi'nin (Yozgat) phenopelopoid akarları üzerine sistematik araştırmalar
Systematic investigations on the phenopelopoid mites of Karanlıkdere Valley (Yozgat)
SALİH KÖKEZ