Geri Dön

Developing a deep learning based offline optical character recognition model for printed Ottoman turkish

Derin öğrenme tabanlı çevrimdışı Osmanlıca basılı karakter tanıma modeli geliştirilmesi

  1. Tez No: 856822
  2. Yazar: AHMED NADHEER QASIM AL-KHAFFAF
  3. Danışmanlar: DOÇ. DR. ÜMİT ATİLA
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2024
  8. Dil: İngilizce
  9. Üniversite: Gazi Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 91

Özet

Basılı Osmanlıca metinler için etkili optik karakter tanıma (OCR) sistemi oluşturmak çok yönlü zorluklara sahiptir. Arapça yazılar için oluşturulan mevcut OCR modelleri Osmanlıca bir metindeki nüanslarla karşılaştığında birçok yetersizlikle karşı karşıya kalmaktadır. Bu modeller ile özellikle Osmanlıca metinlerin tanınması istendiğinde kötü sonuçlar elde edilmesi, bu modellerin Osmanlı dil kalıplarının benzersiz özelliklerini ayırt etmede zorluklar çektiğini göstermektedir. Dahası, bu modellerin yeterliliğini Osmanlıca metinler üzerinde uzmanlaşmış eğitimlerle destekleme girişimleri, istenen sonuçları da vermemektedir. Bu durum, Osmanlıca optik karakter tanıma için daha verimli yöntemlerin oluşturulması gerektiğini göstermektedir. Bu çalışmanın amacı, Matbu yazı tipinde sunulan basılı Osmanlıca belgelerde Osmanlıca'nın kendine has karmaşık dinamiklerini ele alarak karakter tanımayı gerçekleştirebilecek bir derin öğrenme modeli oluşturmaktadır. Bu model, konvolüsyonel sinir ağlarını (CNN) çift yönlü uzun kısa-süreli bellek (BiLSTM) birimleriyle sorunsuz bir şekilde entegre eden uçtan uca eğitilebilir bir mimariyi içermektedir. Önerilen derin öğrenme modelinin, test veri kümesinde %87.1 hassasiyet, %93.3 kesinlik ve %99.6 doğruluk elde etmesi Osmanlıca karakter tanıma için verimli bir yöntem olduğunu göstermektedir. Basılı Osmanlıca metinlerde karakter tanımanın yüksek doğrulukla gerçekleştirilmesi ileride gerçekleştirilecek Osmanlıca'dan Türkçe'ye alfabe ve dil çevirisi çalışmaları için de güçlü bir zemin hazırlayacaktır.

Özet (Çeviri)

Creating an effective optical character recognition (OCR) system for printed Ottoman texts poses multifaceted challenges. Current OCR models created for Arabic texts face many inadequacies when faced with the nuances of an Ottoman text. The fact that these models yield poor results, especially when recognizing Ottoman texts, shows that these models have difficulties in distinguishing the unique features of Ottoman language patterns. Moreover, attempts to support the adequacy of these models with specialized training on Ottoman texts do not yield the desired results. This situation shows that more efficient methods need to be created for Ottoman optical character recognition. The aim of this study is to create a deep learning model that can perform character recognition by considering the unique complex dynamics of Ottoman Turkish in printed Ottoman documents presented in Matbu font. This model incorporates an end-to-end trainable architecture that seamlessly integrates convolutional neural networks (CNNs) with bidirectional long short-term memory (BiLSTM) units. The fact that the proposed deep learning model achieved 87.1% sensitivity, 93.3% precision and 99.6% accuracy on the test dataset shows the efficiency of the method for Ottoman character recognition. Performing character recognition with high accuracy in printed Ottoman texts will also provide a strong basis for future alphabet and language translation studies.

Benzer Tezler

  1. Havayoluyla yapılan uluslararası yük ve yolcu taşıma sözleşmelerinde taşıyıcının sorumluluğu

    The liability of the carrier i̇n the contract of i̇nternational air transport of passengers and cargo

    EMRE YOLCU

    Yüksek Lisans

    Türkçe

    Türkçe

    2014

    HukukKırıkkale Üniversitesi

    Özel Hukuk Ana Bilim Dalı

    DOÇ. DR. RAUF KARASU

  2. Ekonomik krizlerin istihdama etkileri: Türkiye örneği

    Effects of economi̇cal cri̇si̇s on employment: The Turkey example

    ÖMER EREN HENDEK

    Yüksek Lisans

    Türkçe

    Türkçe

    2013

    EkonomiKırıkkale Üniversitesi

    İktisat Ana Bilim Dalı

    YRD. DOÇ. DR. TANER TAYLAN DOĞAN

  3. Kardiyopulmoner bypass ile açık kalp cerrahisi uygulanan hastalarda orta ve hafif hipotermik bypass yöntemlerinin neutrophıl gelatınase assocıated lıpocalın (NGAL), cystatın c ve near ınfrared spectroscopy (NIRS) yöntemi ile ölçülen renal perfüzyon üzerine etkilerinin karşılaştırılması

    Comparing the effects of mild and moderate hypothermia on renal perfusion evaluated with neutrophil gelatinase associated lipocalin, cystatin c and near-infrared spectroscopy in patients undergoing cardiopulmonary bypass graft surgery

    SERKAN YILDIRIM

    Tıpta Uzmanlık

    Türkçe

    Türkçe

    2014

    Göğüs Kalp ve Damar CerrahisiSelçuk Üniversitesi

    Kalp ve Damar Cerrahisi Ana Bilim Dalı

    DOÇ. DR. MEHMET ALKILIÇ HORASANI ÖÇ

  4. 1950 sonrası Türk Resim Sanatı'nda soyutlama eğilimleri ve plastik çözümlemeler

    Abstracti̇on trends and plasti̇c analysi̇es of after 1950 Turki̇sh Pai̇nti̇ng Art

    SABRİYE ÖZTÜTÜNCÜ

    Yüksek Lisans

    Türkçe

    Türkçe

    2013

    Güzel SanatlarAkdeniz Üniversitesi

    Resim Ana Sanat Dalı

    PROF. SADETTİN SARI

  5. Cinsel yolla bulaşan enfeksiyon etkenlerinin tanısında kullanılan konvansiyonel yöntemler ve DPO TM (dual priming oligonükleotid) tabanlı multipleks PCR yönteminin karşılaştırılması

    Comparison of conventional methods used in the diagnosis of sexually transmitted infectionsand DPO TM (Dual priming oligonükletid) based multiplex PCR method

    DEMET FURKAN SEVİNDİ

    Tıpta Uzmanlık

    Türkçe

    Türkçe

    2013

    MikrobiyolojiSağlık Bakanlığı

    Tıbbi Mikrobiyoloji Ana Bilim Dalı

    DOÇ. DR. BERRİN ESEN