Geri Dön

Developing a deep learning based offline optical character recognition model for printed Ottoman turkish

Derin öğrenme tabanlı çevrimdışı Osmanlıca basılı karakter tanıma modeli geliştirilmesi

  1. Tez No: 856822
  2. Yazar: AHMED NADHEER QASIM AL-KHAFFAF
  3. Danışmanlar: DOÇ. DR. ÜMİT ATİLA
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2024
  8. Dil: İngilizce
  9. Üniversite: Gazi Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 91

Özet

Basılı Osmanlıca metinler için etkili optik karakter tanıma (OCR) sistemi oluşturmak çok yönlü zorluklara sahiptir. Arapça yazılar için oluşturulan mevcut OCR modelleri Osmanlıca bir metindeki nüanslarla karşılaştığında birçok yetersizlikle karşı karşıya kalmaktadır. Bu modeller ile özellikle Osmanlıca metinlerin tanınması istendiğinde kötü sonuçlar elde edilmesi, bu modellerin Osmanlı dil kalıplarının benzersiz özelliklerini ayırt etmede zorluklar çektiğini göstermektedir. Dahası, bu modellerin yeterliliğini Osmanlıca metinler üzerinde uzmanlaşmış eğitimlerle destekleme girişimleri, istenen sonuçları da vermemektedir. Bu durum, Osmanlıca optik karakter tanıma için daha verimli yöntemlerin oluşturulması gerektiğini göstermektedir. Bu çalışmanın amacı, Matbu yazı tipinde sunulan basılı Osmanlıca belgelerde Osmanlıca'nın kendine has karmaşık dinamiklerini ele alarak karakter tanımayı gerçekleştirebilecek bir derin öğrenme modeli oluşturmaktadır. Bu model, konvolüsyonel sinir ağlarını (CNN) çift yönlü uzun kısa-süreli bellek (BiLSTM) birimleriyle sorunsuz bir şekilde entegre eden uçtan uca eğitilebilir bir mimariyi içermektedir. Önerilen derin öğrenme modelinin, test veri kümesinde %87.1 hassasiyet, %93.3 kesinlik ve %99.6 doğruluk elde etmesi Osmanlıca karakter tanıma için verimli bir yöntem olduğunu göstermektedir. Basılı Osmanlıca metinlerde karakter tanımanın yüksek doğrulukla gerçekleştirilmesi ileride gerçekleştirilecek Osmanlıca'dan Türkçe'ye alfabe ve dil çevirisi çalışmaları için de güçlü bir zemin hazırlayacaktır.

Özet (Çeviri)

Creating an effective optical character recognition (OCR) system for printed Ottoman texts poses multifaceted challenges. Current OCR models created for Arabic texts face many inadequacies when faced with the nuances of an Ottoman text. The fact that these models yield poor results, especially when recognizing Ottoman texts, shows that these models have difficulties in distinguishing the unique features of Ottoman language patterns. Moreover, attempts to support the adequacy of these models with specialized training on Ottoman texts do not yield the desired results. This situation shows that more efficient methods need to be created for Ottoman optical character recognition. The aim of this study is to create a deep learning model that can perform character recognition by considering the unique complex dynamics of Ottoman Turkish in printed Ottoman documents presented in Matbu font. This model incorporates an end-to-end trainable architecture that seamlessly integrates convolutional neural networks (CNNs) with bidirectional long short-term memory (BiLSTM) units. The fact that the proposed deep learning model achieved 87.1% sensitivity, 93.3% precision and 99.6% accuracy on the test dataset shows the efficiency of the method for Ottoman character recognition. Performing character recognition with high accuracy in printed Ottoman texts will also provide a strong basis for future alphabet and language translation studies.

Benzer Tezler

  1. Generative adversarial networks based level generation for angry birds

    Çekişmeli üretici ağlar ile angry birds bölümlerinin üretilmesi

    BURKAN YILMAZ

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Oyun ve Etkileşim Teknolojileri Ana Bilim Dalı

    DOÇ. DR. SANEM SARIEL UZER

  2. Mobil cihazlar ile derin öğrenme mimarisi kullanarak gerçek zamanlı video nesne izleme

    Deep learning architectures for real-time video object tracking by mobile devices

    ULAŞ TOSUN

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    PROF. DR. BİLGE GÜNSEL KALYONCU

  3. Resolution of structural ambiguities during real-time l2 sentence processing: Evidence from online and offline measures

    İkinci dilin gerçek zamanlı olarak işlemlenmesi sırasında yapısal belirsizliklerin çözümlenmesi: Çevrimiçi ve çevrimdışı yöntemlerden edinilen bulgular

    ONUR ULUDAĞ

    Doktora

    İngilizce

    İngilizce

    2018

    Eğitim ve ÖğretimÇukurova Üniversitesi

    İngiliz Dili Eğitimi Ana Bilim Dalı

    PROF. DR. HATİCE SOFU

  4. Derin öğrenme tabanlı seyahat öneri sistemi geliştirme

    Developing a deep learning based travel recommendation system

    ALİHAN ÖZ

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolYıldız Teknik Üniversitesi

    Matematik Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ MERT BAL

    DR. ÖĞR. ÜYESİ MERYEM UZUN PER

  5. Uzaktan algılama verileri kullanarak derin öğrenmeye dayalı arazi kullanımı ve arazi örtüsü haritalama modeli geliştirme

    Developing a deep learning-based land use and land cover mapping model using remote sensing data

    ŞAZİYE ÖZGE ATİK

    Doktora

    Türkçe

    Türkçe

    2021

    Jeodezi ve Fotogrametriİstanbul Teknik Üniversitesi

    Geomatik Mühendisliği Ana Bilim Dalı

    PROF. DR. CENGİZHAN İPBÜKER