Raspbraılle: Optik karakter tanıma ve ses tanıma algoritması ile Braille alfabesine dönüşüm
Raspbraille: Conversion to Braille alphabet with optical character recognition and speech recognition algorithm
- Tez No: 733337
- Danışmanlar: DOÇ. DR. KAZIM YILDIZ, DR. ÖĞR. ÜYESİ EYÜP EMRE ÜLKÜ
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2022
- Dil: Türkçe
- Üniversite: Marmara Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
- Sayfa Sayısı: 72
Özet
Görme engelli bireyler için fiziksel olarak basılmış kitap, makale veya yayınlanmış herhangi bir materyali okuyup incelemek hayatları boyunca oldukça zor bir mücadeledir. Aynı zamanda günlük hayatlarındaki her yerde karşılarına çıkabilecek fiziksel olarak basılı tabela ve metin gibi materyalleri okumak da problem yaşamaktadırlar. Görme engelli bireyler ile diğer bireyler arasındaki bilgi akışını ve iletişimi teşvik etmek için iletişimdeki bu asimetriyi dengelemeye yardımcı olabilecek teknolojilere ihtiyaç vardır [1]. Bu amaçla, görme engelli bireyler için okuyabilecekleri bir alfabe geliştirilmiştir. Bu alfabe kendisi de görme engelli olan Louis Braille tarafından icat edilmiş ve onun adıyla Braille alfabesi olarak isimlendirilmiştir. Braille sistemini oluşturan Louis Braille, bir yazı mucidi olarak da kabul edilir [2]. Bu devrimci sistem ile birlikte görme engelli bireylerin yazılı kültüre erişmesine imkan sağlanmıştır ve yaşam kalitesinde de büyük bir ilerleme görülmüştür [2]. Braille harfleri olarak da bilinen bu alfabe görme engelliler için tasarlanmış özel harflerden oluşmaktadır. Bir Braille harfi, üç sıra iki sütundan oluşan dikdörtgen şeklinde düzenlenmiş altı noktanın değişik şekilde kombinasyonu sonucuyla ifade edilir. Bu noktalar ile altmış dört farklı kombinasyon oluşabilmektedir. Optik karakter tanıma teknolojisi evrakları, pdf gibi dosyaları ve kamerayla çekilen resimleri düzenleyebilir ve aranabilir verilere dönüştürebilir. Resimlerdeki harfleri seçip ayırır. Harflerden kelimeleri, kelimelerden cümleleri ve paragrafları doğru bir çıktı olarak verir. Optik karakter tanıma arka planı beyaz olarak gelen verinin üzerinde siyah noktalardan oluşan bütünü yani harfleri, sayıları, sembolleri ya da diğer imgeleri vb. algılayacak ve okuyacak bir yapıya sahiptir. Konuşma tanıma algoritması, bilgisayar, tablet, cep telefonu, ses kaydedici cihazlar vb. gibi teknolojik ürünlerle insan sesinin bir mikrofon aracılığıyla algılanıp tanınması işlemidir. Tez kapsamında ilk olarak Braille alfabesine çevrilmesi istenen kitapların her bir sayfasının görseli alınarak optik karakter tanıma algoritmasıyla belirli bir karakter seti kullanılarak bir dönüşüm gerçekleştirilmiştir. Bir diğer adım ise konuşma ile okunarak kaydedilmiş kitapların sesin metne dönüştürülmesi algoritmasıyla her bir harfin Braille alfabesine hızlı bir şekilde dönüşüm işlemi yapılmıştır. İki aşama sonrasında dönüştürülen bu karakterlerin elde edilmesiyle, görme engelli bireylerin okuyabileceği Braille harflerinin gösterimi için fiziksel bir donanım cihazı geliştirilmiştir.
Özet (Çeviri)
Reading and examining physically printed books, articles or any published material is a very difficult struggle for visually impaired individuals throughout their lives. At the same time, they also have problems reading materials such as physically printed signage and text that they may encounter everywhere in their daily lives. Technologies that can help balance this asymmetry in communication are needed to encourage the flow of information and communication between visually impaired individuals and other individuals [1]. For this purpose, an alphabet has been developed for visually impaired individuals. This alphabet was invented by Louis Braille, who is also visually impaired, and named after him as the Braille alphabet Louis Braille, who created the Braille system, is also considered an inventor of writing [2]. With this revolutionary system, visually impaired individuals have been given access to written culture and a great improvement has been observed in the quality of life [2]. This alphabet, also known as Braille letters, consists of special letters designed for the visually impaired. A Braille letter is expressed as a result of different combinations of six dots arranged in a rectangle made up of three rows and two columns. Sixty-four different combinations can be formed with these points. Optical character recognition technology can organize documents, pdf files and pictures taken with the camera and convert them into searchable data. It can detect and separate the letters in the pictures. It gives accurate output of words, sentences, paragraphs from words. Optical character recognition has a structure to perceive and read all things consisting of black dots, namely letters, numbers, symbols or other images, etc., on a white background. Speech recognition algorithm is the process of detecting and recognizing the human voice through a microphone with technological products such as computers, tablets, mobile phones, voice recorders, etc. Within the scope of the thesis, firstly, the images of each page of the books to be translated into Braille alphabet were taken and a transformation was carried out using a certain character set with the optical character recognition algorithm. Another step is to convert each letter into Braille alphabet quickly with the algorithm of converting the voice to text of the books recorded by reading with speech. By obtaining these converted characters after two stages, a physical hardware device has been developed for displaying Braille letters that can be read by visually impaired individuals.