Geri Dön

Derin öğrenme ile gerçek zamanlı türkçe işaret dili ifade tanıma

Real-time recognition of turkish sign language expression using deep learning

  1. Tez No: 953216
  2. Yazar: CUMHUR TORUN
  3. Danışmanlar: DOÇ. DR. ABDULKADİR KARACI
  4. Tez Türü: Doktora
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2025
  8. Dil: Türkçe
  9. Üniversite: Kastamonu Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Malzeme Bilimi ve Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 117

Özet

Bu çalışma, Türk İşaret Dili (TİD) ifadelerinin gerçek zamanlı tanınmasını sağlamak amacıyla MediaPipe tabanlı iskelet verisi çıkarımı ve derin öğrenme modellerinin kullanımını kapsamaktadır. Çalışmanın temel amacı, işaret dili bilmeyen bireylerin TİD kullanıcılarıyla daha etkili iletişim kurmasını sağlamak ve işitme engelli bireylerin toplumsal entegrasyonunu desteklemektir. Bu doğrultuda, Millî Eğitim Bakanlığı'nın TİD Dersi Öğretim Materyali esas alınarak 446 kelimeden oluşan özgün bir veri seti geliştirilmiş ve TurkSign446 olarak adlandırılmıştır. Hem statik hem de dinamik işaretleri içeren bu veri seti, cihazdan bağımsız ve kapsamlı bir yapıda oluşturulmuş; MediaPipe Holistic kütüphanesi aracılığıyla vücut, el ve yüz anahtar noktalarından elde edilen iskelet görüntüleriyle desteklenmiştir. Veri seti %70 eğitim, %10 doğrulama ve %20 test olmak üzere dışarda tutma (hold-out) yöntemiyle ayrılmıştır. Bu veriler üzerinde LSTM, Bi-LSTM, GRU ve CNN gibi temel modellerin yanı sıra CNN+GRU, CNN+LSTM, CNN+BiLSTM, GRU+LSTM ve GRU+BiLSTM gibi hibrit mimariler de eğitilmiş; en yüksek test doğruluğu %97,72 ile CNN+GRU modeli tarafından elde edilmiştir. Bu model, eğitim sürecine dâhil edilmiş ve edilmemiş iki farklı katılımcı üzerinden gerçek zamanlı olarak test edilmiş; kelimeler için 10 tekrar içeren senaryolar sonucunda sırasıyla %85,50 ve %80,26 genel başarı oranlarına ulaşılmıştır. Ayrıca, her kelimeye ait 30 çerçevelik iskelet görüntüleri; ızgara, optik akış ve yatay birleştirme yöntemleriyle farklı temsillere dönüştürülmüş ve bu temsiller üzerinden ResNet18 ile dikkat mekanizması içeren CBAM+ResNet18 mimarileri eğitilmiştir. En yüksek doğruluk değeri, %97,30 ile CBAM+ResNet18 modeli ve optik akış temsili kullanılarak elde edilmiştir. Sonuç olarak, TurkSign446 veri seti ve bu çalışma kapsamında uygulanan derin öğrenme tabanlı yaklaşımlar, Türk İşaret Dili'nin gerçek zamanlı tanınmasına yönelik önemli bir temel oluşturmaktadır. Çalışma, hem akademik araştırmalarda hem de uygulamalı sistem geliştirmelerinde kullanılabilir niteliktedir. Gelecekte, veri setinin genişletilmesi ve hibrit modellerin daha karmaşık ifadeleri tanıyacak biçimde optimize edilmesi planlanmaktadır.

Özet (Çeviri)

This study focuses on the use of MediaPipe-based skeleton data extraction and deep learning models to enable the real-time recognition of Turkish Sign Language (TİD) expressions. The primary objective is to facilitate more effective communication between individuals who do not know sign language and TİD users, thereby promoting the social inclusion of hearing-impaired individuals. In this context, an original dataset consisting of 446 words was developed based on the Turkish Ministry of National Education's TİD Course Teaching Material and named TurkSign446. This dataset includes both static and dynamic signs and was constructed to be comprehensive and device-independent. Skeleton images were obtained using the MediaPipe Holistic library by capturing keypoints from the body, hands, and face. The dataset was split using the hold-out method into 70% for training, 10% for validation, and 20% for testing. On this dataset, various baseline models such as LSTM, Bi-LSTM, GRU, and CNN were trained, along with hybrid architectures including CNN+GRU, CNN+LSTM, CNN+BiLSTM, GRU+LSTM and, GRU+BiLSTM. The highest test accuracy of 97.72% was achieved with the CNN+GRU model. This model was also tested in real time with two participants—one included in the training data and one excluded. In test scenarios involving 10 repetitions, overall success rates of 85.50% and 80.26% were recorded for the seen and unseen participants, respectively. Additionally, for each word, 30-frame skeleton sequences were transformed into different visual representations using grid, optical flow, and horizontal concatenation methods. Based on these representations, ResNet18 and CBAM+ResNet18 architectures (the latter incorporating an attention mechanism) were trained. The highest recognition accuracy 97.30% was obtained using the CBAM+ResNet18 model with optical flow data. In conclusion, the TurkSign446 dataset and the deep learning-based approaches implemented in this study provide a significant foundation for real-time recognition of Turkish Sign Language. The results indicate that the system is applicable for both academic research and practical deployments. In future work, it is planned to expand the dataset and further optimize hybrid models to recognize more complex sign language expressions.

Benzer Tezler

  1. Derin öğrenme yöntemleri ile Türk işaret dilinin öğrenilmesi

    Turkish sign language recognition with deep learning methods

    MELEK ALAFTEKİN ÇAKMAK

    Yüksek Lisans

    Türkçe

    Türkçe

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolIğdır Üniversitesi

    Elektrik-Elektronik Ana Bilim Dalı

    DOÇ. DR. KENAN ÇİÇEK

  2. Türk işaret dilinde kelime tabanlı derin öğrenme uygulaması

    Deep learning algorithms to recognize word based Turkish sign language

    MEHMET ERKUŞ

    Yüksek Lisans

    Türkçe

    Türkçe

    2020

    Elektrik ve Elektronik MühendisliğiBaşkent Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ SELDA GÜNEY

  3. Wolfgang Borcherts Stellungnahme zum Krieg in seinen Kurzgeschichten ab 1945

    Başlık çevirisi yok

    ZEKİ KARAKAYA

    Yüksek Lisans

    Almanca

    Almanca

    1988

    Alman Dili ve EdebiyatıHacettepe Üniversitesi

    DOÇ. DR. NURAN ÖZYER

  4. Türk işaret dili alfabesinin derin öğrenme yöntemi ile sınıflandırılması

    Classification of turkish sign language alphabet with deep learning method

    ZEREN BERNA KIN

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    Elektrik ve Elektronik MühendisliğiBaşkent Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    PROF. DR. HAMİT ERDEM

  5. Görsel dikkat modeli ve derin öğrenme yöntemleri kullanılarak geniş dağarcıklı ayrık işaret dili tanıma sisteminin modellenmesi

    Modeling a large vocabulary isolated sign language recognition system using visual attention model and deep learning methods

    ÖZGE MERCANOĞLU SİNCAN

    Doktora

    Türkçe

    Türkçe

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAnkara Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. HACER YALIM KELEŞ