Geri Dön

Türkiye'de konuşulan dillerin derin öğrenme yöntemleriyle sınıflandırılması

Classification of languages spoken in Türki̇ye using deep learning methods

  1. Tez No: 956982
  2. Yazar: MÜGE ERTEKİN
  3. Danışmanlar: PROF. DR. HAMİT ERDEM
  4. Tez Türü: Yüksek Lisans
  5. Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2025
  8. Dil: Türkçe
  9. Üniversite: Başkent Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Elektrik Elektronik Mühendisliği Bilim Dalı
  13. Sayfa Sayısı: 78

Özet

Günümüzde konuşan dil tanıma sistemleri; insan-makine etkileşimi, robotik uygulamalar, çok dilli iletişim ve güvenlik gibi çeşitli alanlarda yaygın olarak kullanılmaktadır. Bu sistemler, otonom robotik etkileşim, çok dilli müşteri hizmetleri ve otomatik çeviri gibi uygulamalarda etkin rol oynamaktadır. Ayrıca, güvenlik ve adli bilişimde anonim ses kayıtlarının dilini belirlemek; göçmen profilleme ve istihbarat analizleri açısından önem taşımaktadır. Bu tez çalışmasında, Türkiye'de yaygın olarak konuşulan diller olarak, Türkiye'ye yerleşen ve Türkiye'yi sıkça ziyaret eden yabancı uyruklu bireylerin konuştukları diller esas alınarak bir veri seti oluşturulmuştur. Bu kapsamda hazırlanan veri setinde; Türkçe, Kürtçe, Arapça, Rusça, Farsça ve Almanca dillerine ait ses kayıtları yer almaktadır. Konuşulan dili otomatik olarak tanıma problemi, bir sınıflandırma problemi olarak ele alınmıştır. Bu problemi çözmek amacıyla farklı derin öğrenme mimarileri kullanılmıştır. İlk olarak, spektral özelliklerin zamansal örüntülerini yakalamada etkili olan İki Yönlü Uzun Kısa Süreli Bellek (BiLSTM) ağları uygulanmıştır. Ayrıca, mekânsal örüntüleri çıkarmada başarılı olan Evrişimsel Sinir Ağları (CNN) ile birlikte, dil tanıma problemlerinde son yıllarda dikkat çekici başarılar gösteren Transformer tabanlı Encoder mimarisi de değerlendirilmiştir. Bunun yanı sıra, CNN ve self-attention mekanizmalarını aynı yapıda birleştirerek hem yerel hem de küresel bağlamı yakalayabilen Conformer Encoder mimarisi de çalışmada uygulanmış ve karşılaştırmalı analiz yapılmıştır. Modelin performansını değerlendirmek amacıyla doğruluk (accuracy), duyarlılık (sensitivity/recall) ve diğer ilgili performans metrikleri kullanılmıştır.

Özet (Çeviri)

Today, spoken language identification systems are widely used in various domains such as human-machine interaction, robotics, multilingual communication, and security. These systems play an important role in applications like autonomous robotic interaction, multilingual customer services, and automatic translation. Moreover, identifying the language of anonymous voice recordings has become increasingly significant in fields such as security, forensic informatics, immigration profiling, and intelligence analysis. In this thesis, a dataset was created based on the languages commonly spoken in Türkiye, including those spoken by foreign nationals who have settled in or frequently visit the country. The dataset includes voice recordings in Turkish, Kurdish, Arabic, Russian, Persian, and German. The task of automatically recognizing the spoken language is addressed as a classification problem. To solve this problem, various deep learning architectures were implemented. First, Bidirectional Long Short-Term Memory networks were used due to their effectiveness in capturing the temporal patterns of spectral features. Additionally, Convolutional Neural Networks, which are successful in extracting spatial patterns, and Transformer-based encoder architectures, which have shown remarkable performance in recent language recognition tasks, were also evaluated. Furthermore, the Conformer encoder architecture, which combines CNN and self-attention mechanisms to capture both local and global contexts simultaneously, was applied and compared with other models. To evaluate model performance, accuracy, recall (sensitivity), and other relevant performance metrics were utilized.

Benzer Tezler

  1. Билим, илим жана маданият тармагындагы Кыргызстан менен Түркиянын кызматташтыгы (1992-2012 жж.)

    Kırgız Cumhuriyeti ile Türkiye Cumhuriyeti arasında eğitim, bilim ve kültürel ilişkiler (1992-2012)

    KADRİ AĞGÜN

    Doktora

    Kırgızca

    Kırgızca

    2016

    TarihKyrgyz State University named after I Arabaev

    Tarih Ana Bilim Dalı

    PROF. DR. TÖLÖBEK ABDRAHMANOV

  2. Probleme bei der didaktik der berufssprache Deutsch im Türkischen hochschulwesen und alternative lösungsvorschläge in bezug auf die akademische ausbildung

    Türkiye'de yükseköğretim bünyesinde sunulan mesleki uzmanlık dili olarak Almanca dersinde yaşanan aksaklıklar ve akademik öğreti açısından ön görülen alternatif çözüm yolları

    SELAHADDİN SOYUDOĞRU

    Yüksek Lisans

    Almanca

    Almanca

    2019

    Eğitim ve ÖğretimÇukurova Üniversitesi

    Alman Dili Eğitimi Ana Bilim Dalı

    DOÇ. DR. YASEMİN DARANCIK

  3. Erste fremdsprachenwahl in der fremdsprachendidaktik im primᾱr- und sekundᾱrbereich: Zu wahlkriterien aus pᾱdagogischer und struktureller perspektive

    İlk ve orta öğretim yabancı dil eğitiminde birinci yabancı dil seçimi: Pedagojik ve yapısal açıdan tercih ölçütleri üzerine

    AİŞE SEZİK

    Yüksek Lisans

    Almanca

    Almanca

    2015

    Eğitim ve ÖğretimÇukurova Üniversitesi

    Alman Dili Eğitimi Ana Bilim Dalı

    PROF. DR. ERGÜN SERİNDAĞ

  4. La Vie artistique litteraire culturelle et sociale l'Izmir en langue Française (du XVII'eme siecle a nos jours)

    Fransızca'da İzmir'in sanatsal edebi kültürel ve toplumsal yaşamı (XVII'inci yüzyıldan günümüze)

    HASAN ZORLUSOY

    Doktora

    Fransızca

    Fransızca

    1993

    Fransız Dili ve EdebiyatıDokuz Eylül Üniversitesi

    Fransız Dili ve Edebiyatı Ana Bilim Dalı

    PROF. DR. EROL KAYRA

  5. Die Adjektivalergaenzung im Deutschen und ihre Entsprechungen im Türkischen

    Başlık çevirisi yok

    SONER KUTLAR

    Yüksek Lisans

    Almanca

    Almanca

    1988

    DilbilimHacettepe Üniversitesi

    Alman Dili ve Edebiyatı Bilim Dalı

    PROF.DR. SÜLEYMAN YILDIZ