Alignment and multimodal analysis in signed speech
İşaret dili videolarından ayrık işaret çıkarımı
- Tez No: 246259
- Danışmanlar: PROF. LALE AKARUN
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2009
- Dil: İngilizce
- Üniversite: Boğaziçi Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Bölümü
- Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Sayfa Sayısı: 101
Özet
Bu tezde, duraklamasız, işaretlenmiş Türkçe videolarından otomatik ayrık işaret çıkarımı yapan bir yöntem geliştirdik. İşaretlenmiş Türkçe, Türk işaret dilindeki işaretlerin, Türkçe konuşma diline ait dilbilgisi kuralları dahilinde kullanılmasından oluşmuş görsel bir dildir ve el şekli ile el hareketlerinden oluşur. Duraklamasız işaret dilinde peş peşe yapılan işaretler birbirlerini etkileyebilir ve işaretlerin başında ve sonunda değişimler olabilir. Bu da ayrık işaret çıkarımını zorlaştırır. Bu çalışmada, el işaretleri bilgisini kullanarak Türk işaret dilinde sıklıkla kullanılan bazı işaretlerin ayrık çıkarımını yapmayı amaçladık. Kullandığımız yöntem iki adımdan oluşmaktadır: İlk olarak, el takibi modülü kullanılarak elde edilmiş el bölgelerine bölütleme uygulayıp sadece sağ veya sol eli içeren resimler elde ettik. Daha sonra el işaretlerini çeşitli yöntemler kullanarak betimledik. Bunlar şu şekilde sıralanabilir: 1) Ellerin merkez koordinatları ve bu koordinatların türevleri, 2) Her bir el için elips değişkenleri, 3) Ayrık kosinüs dönüşümü, 4) Yönlü Gradyan Histogramı, 5) Yerel Ikili Örüntü yöntemi, 6) Hu momentleri, ve 7) Işınsal Uzaklık fonksiyonu. Daha sonra işaret dizilerini çeşitli yöntemler kullanarak hizalayıp işaretlerin başlangıç ve bitiş noktalarını bulduk. Hizalama yöntemleri olarak dinamik zaman bükmesi (DTW), saklı Markov modeli (HMM) ve bağlaştırılmış HMM kullandık. Ayrıca sistemimizin başarımını arttırmak amacıyla bazı tümleştirme yöntemleri uyguladık. Sistemimizin başarımını işaretlenmiş Türkçe videolarından oluşan bir veri tabanı üzerinde gösterdik. Buna göre, DTW ile HMM algoritmaları birleştirildiğinde ve öznitelik olarak merkez koordinatları, bu koordinatların türevleri, ve elips değişkenleri kullanıldığında en yüksek başarımı elde ettik.
Özet (Çeviri)
In this thesis, we attack the problem of extracting isolated signsfrom continuous signed speech videos. Signed speech is a languagethat uses the signs of sign language and the grammar of spoken language.It is a visual language and makes use of hand gestures, whichconsist of hand motion and hand shape. In continuous signedspeech, signs are expressed in succession, whichresults in coarticulation effects, making segmentation a challengingtask. In this work, we aim to segment some of the most common signsin Turkish Sign Language using hand gesture information. Thisprocess consists of two consecutive steps: First, we apply segmentationto hand regions obtained from a hand tracking module andobtain images containing only the left or the right hand. Then, werepresent hand gestures by a variety of features which can becategorized as follows: 1) Center of mass coordinates of each handand their first-order derivatives, 2) Ellipse parameters for eachhand, 3) Discrete CosineTransform, 4) Histogram of oriented gradients, 5) Local BinaryPatterns, 6) Hu Moments, and 7) Radial Distances. Then, we alignthe sequences with different methods and find the startand end positions for each sign. We use Dynamic Time Warping (DTW), HiddenMarkov Models (HMM), and coupled HMMs as differentalignment approaches. We also apply some fusion techniques toimprove the alignment performances. We experiment on a database fromTurkish signed speech videos and report the results. We see that thehighest accuracy is obtained by combining the DTW and HMM methods usingCenter of mass coordinates, their first-order derivatives, and Ellipsefeatures.
Benzer Tezler
- A conversation analytic investigation of resources for alignment and affiliation in topic management during video-mediated virtual exchange
Video aracılı sanal değişimlerde konu yönetiminde uyum ve yakınlık kurma kaynaklarını inceleyen bir konuşma çözümlemesı araştırması
BETÜL ÇİMENLİ
Doktora
İngilizce
2025
Eğitim ve ÖğretimOrta Doğu Teknik Üniversitesiİngilizce Öğretmenliği Ana Bilim Dalı
DOÇ. DR. HALE IŞIK GÜLER
DOÇ. DR. UFUK BALAMAN
- Neural and ocular correlates of conceptual grounding in verbal interaction: A multimodal hyperscanning approach
Sözel etkileşimde kavramsal temel edinmenin sinirsel ve oküler örüntüleri: Bir çok kipli hiper tarama yaklaşimi
EFECAN YILMAZ
Doktora
İngilizce
2024
DilbilimOrta Doğu Teknik ÜniversitesiBilişsel Bilim Ana Bilim Dalı
DOÇ. DR. MURAT PERİT ÇAKIR
- Multimodal learning for speech analysis with mmwave radar, ultrasound, and audio
Konuşma analizinde mmwave radar, ultrason ve ses verileriyle öğrenme
İLHAN AYTUTULDU
Doktora
İngilizce
2025
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGebze Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. YUSUF SİNAN AKGÜL
- Dikkat eksikliği ve hiperaktivite bozukluğu olan çocukların el yazılarının görüntü işleme teknikleri ile analizi
Analysis of handwriting of children with attention deficit hyperactivity disorder using image processing techniques
ÖZLEM YILDIZ BUDAK
Yüksek Lisans
Türkçe
2025
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSakarya ÜniversitesiBilgisayar ve Bilişim Mühendisliği Ana Bilim Dalı
DOÇ. DR. MUHAMMED FATİH ADAK
- Detecting novel behavior and process improvement with multi-modal process mining
Çok modlu süreç madenciliği ile yeni davranışın tespiti ve süreç iyileştirme
ABDURRAHMAN TELLİ
Yüksek Lisans
İngilizce
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHacettepe ÜniversitesiBilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı
DOÇ. DR. AYÇA KOLUKISA TARHAN
DR. TUĞBA GÜRGEN ERDOĞAN