Türkiye'de konuşulan dillerin derin öğrenme yöntemleriyle sınıflandırılması
Classification of languages spoken in Türki̇ye using deep learning methods
- Tez No: 956982
- Danışmanlar: PROF. DR. HAMİT ERDEM
- Tez Türü: Yüksek Lisans
- Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2025
- Dil: Türkçe
- Üniversite: Başkent Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Elektrik Elektronik Mühendisliği Bilim Dalı
- Sayfa Sayısı: 78
Özet
Günümüzde konuşan dil tanıma sistemleri; insan-makine etkileşimi, robotik uygulamalar, çok dilli iletişim ve güvenlik gibi çeşitli alanlarda yaygın olarak kullanılmaktadır. Bu sistemler, otonom robotik etkileşim, çok dilli müşteri hizmetleri ve otomatik çeviri gibi uygulamalarda etkin rol oynamaktadır. Ayrıca, güvenlik ve adli bilişimde anonim ses kayıtlarının dilini belirlemek; göçmen profilleme ve istihbarat analizleri açısından önem taşımaktadır. Bu tez çalışmasında, Türkiye'de yaygın olarak konuşulan diller olarak, Türkiye'ye yerleşen ve Türkiye'yi sıkça ziyaret eden yabancı uyruklu bireylerin konuştukları diller esas alınarak bir veri seti oluşturulmuştur. Bu kapsamda hazırlanan veri setinde; Türkçe, Kürtçe, Arapça, Rusça, Farsça ve Almanca dillerine ait ses kayıtları yer almaktadır. Konuşulan dili otomatik olarak tanıma problemi, bir sınıflandırma problemi olarak ele alınmıştır. Bu problemi çözmek amacıyla farklı derin öğrenme mimarileri kullanılmıştır. İlk olarak, spektral özelliklerin zamansal örüntülerini yakalamada etkili olan İki Yönlü Uzun Kısa Süreli Bellek (BiLSTM) ağları uygulanmıştır. Ayrıca, mekânsal örüntüleri çıkarmada başarılı olan Evrişimsel Sinir Ağları (CNN) ile birlikte, dil tanıma problemlerinde son yıllarda dikkat çekici başarılar gösteren Transformer tabanlı Encoder mimarisi de değerlendirilmiştir. Bunun yanı sıra, CNN ve self-attention mekanizmalarını aynı yapıda birleştirerek hem yerel hem de küresel bağlamı yakalayabilen Conformer Encoder mimarisi de çalışmada uygulanmış ve karşılaştırmalı analiz yapılmıştır. Modelin performansını değerlendirmek amacıyla doğruluk (accuracy), duyarlılık (sensitivity/recall) ve diğer ilgili performans metrikleri kullanılmıştır.
Özet (Çeviri)
Today, spoken language identification systems are widely used in various domains such as human-machine interaction, robotics, multilingual communication, and security. These systems play an important role in applications like autonomous robotic interaction, multilingual customer services, and automatic translation. Moreover, identifying the language of anonymous voice recordings has become increasingly significant in fields such as security, forensic informatics, immigration profiling, and intelligence analysis. In this thesis, a dataset was created based on the languages commonly spoken in Türkiye, including those spoken by foreign nationals who have settled in or frequently visit the country. The dataset includes voice recordings in Turkish, Kurdish, Arabic, Russian, Persian, and German. The task of automatically recognizing the spoken language is addressed as a classification problem. To solve this problem, various deep learning architectures were implemented. First, Bidirectional Long Short-Term Memory networks were used due to their effectiveness in capturing the temporal patterns of spectral features. Additionally, Convolutional Neural Networks, which are successful in extracting spatial patterns, and Transformer-based encoder architectures, which have shown remarkable performance in recent language recognition tasks, were also evaluated. Furthermore, the Conformer encoder architecture, which combines CNN and self-attention mechanisms to capture both local and global contexts simultaneously, was applied and compared with other models. To evaluate model performance, accuracy, recall (sensitivity), and other relevant performance metrics were utilized.
Benzer Tezler
- Билим, илим жана маданият тармагындагы Кыргызстан менен Түркиянын кызматташтыгы (1992-2012 жж.)
Kırgız Cumhuriyeti ile Türkiye Cumhuriyeti arasında eğitim, bilim ve kültürel ilişkiler (1992-2012)
KADRİ AĞGÜN
Doktora
Kırgızca
2016
TarihKyrgyz State University named after I ArabaevTarih Ana Bilim Dalı
PROF. DR. TÖLÖBEK ABDRAHMANOV
- Probleme bei der didaktik der berufssprache Deutsch im Türkischen hochschulwesen und alternative lösungsvorschläge in bezug auf die akademische ausbildung
Türkiye'de yükseköğretim bünyesinde sunulan mesleki uzmanlık dili olarak Almanca dersinde yaşanan aksaklıklar ve akademik öğreti açısından ön görülen alternatif çözüm yolları
SELAHADDİN SOYUDOĞRU
Yüksek Lisans
Almanca
2019
Eğitim ve ÖğretimÇukurova ÜniversitesiAlman Dili Eğitimi Ana Bilim Dalı
DOÇ. DR. YASEMİN DARANCIK
- Erste fremdsprachenwahl in der fremdsprachendidaktik im primᾱr- und sekundᾱrbereich: Zu wahlkriterien aus pᾱdagogischer und struktureller perspektive
İlk ve orta öğretim yabancı dil eğitiminde birinci yabancı dil seçimi: Pedagojik ve yapısal açıdan tercih ölçütleri üzerine
AİŞE SEZİK
Yüksek Lisans
Almanca
2015
Eğitim ve ÖğretimÇukurova ÜniversitesiAlman Dili Eğitimi Ana Bilim Dalı
PROF. DR. ERGÜN SERİNDAĞ
- La Vie artistique litteraire culturelle et sociale l'Izmir en langue Française (du XVII'eme siecle a nos jours)
Fransızca'da İzmir'in sanatsal edebi kültürel ve toplumsal yaşamı (XVII'inci yüzyıldan günümüze)
HASAN ZORLUSOY
Doktora
Fransızca
1993
Fransız Dili ve EdebiyatıDokuz Eylül ÜniversitesiFransız Dili ve Edebiyatı Ana Bilim Dalı
PROF. DR. EROL KAYRA
- Die Adjektivalergaenzung im Deutschen und ihre Entsprechungen im Türkischen
Başlık çevirisi yok
SONER KUTLAR
Yüksek Lisans
Almanca
1988
DilbilimHacettepe ÜniversitesiAlman Dili ve Edebiyatı Bilim Dalı
PROF.DR. SÜLEYMAN YILDIZ