Developing a deep learning based offline optical character recognition model for printed Ottoman turkish
Derin öğrenme tabanlı çevrimdışı Osmanlıca basılı karakter tanıma modeli geliştirilmesi
- Tez No: 856822
- Danışmanlar: DOÇ. DR. ÜMİT ATİLA
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2024
- Dil: İngilizce
- Üniversite: Gazi Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 91
Özet
Basılı Osmanlıca metinler için etkili optik karakter tanıma (OCR) sistemi oluşturmak çok yönlü zorluklara sahiptir. Arapça yazılar için oluşturulan mevcut OCR modelleri Osmanlıca bir metindeki nüanslarla karşılaştığında birçok yetersizlikle karşı karşıya kalmaktadır. Bu modeller ile özellikle Osmanlıca metinlerin tanınması istendiğinde kötü sonuçlar elde edilmesi, bu modellerin Osmanlı dil kalıplarının benzersiz özelliklerini ayırt etmede zorluklar çektiğini göstermektedir. Dahası, bu modellerin yeterliliğini Osmanlıca metinler üzerinde uzmanlaşmış eğitimlerle destekleme girişimleri, istenen sonuçları da vermemektedir. Bu durum, Osmanlıca optik karakter tanıma için daha verimli yöntemlerin oluşturulması gerektiğini göstermektedir. Bu çalışmanın amacı, Matbu yazı tipinde sunulan basılı Osmanlıca belgelerde Osmanlıca'nın kendine has karmaşık dinamiklerini ele alarak karakter tanımayı gerçekleştirebilecek bir derin öğrenme modeli oluşturmaktadır. Bu model, konvolüsyonel sinir ağlarını (CNN) çift yönlü uzun kısa-süreli bellek (BiLSTM) birimleriyle sorunsuz bir şekilde entegre eden uçtan uca eğitilebilir bir mimariyi içermektedir. Önerilen derin öğrenme modelinin, test veri kümesinde %87.1 hassasiyet, %93.3 kesinlik ve %99.6 doğruluk elde etmesi Osmanlıca karakter tanıma için verimli bir yöntem olduğunu göstermektedir. Basılı Osmanlıca metinlerde karakter tanımanın yüksek doğrulukla gerçekleştirilmesi ileride gerçekleştirilecek Osmanlıca'dan Türkçe'ye alfabe ve dil çevirisi çalışmaları için de güçlü bir zemin hazırlayacaktır.
Özet (Çeviri)
Creating an effective optical character recognition (OCR) system for printed Ottoman texts poses multifaceted challenges. Current OCR models created for Arabic texts face many inadequacies when faced with the nuances of an Ottoman text. The fact that these models yield poor results, especially when recognizing Ottoman texts, shows that these models have difficulties in distinguishing the unique features of Ottoman language patterns. Moreover, attempts to support the adequacy of these models with specialized training on Ottoman texts do not yield the desired results. This situation shows that more efficient methods need to be created for Ottoman optical character recognition. The aim of this study is to create a deep learning model that can perform character recognition by considering the unique complex dynamics of Ottoman Turkish in printed Ottoman documents presented in Matbu font. This model incorporates an end-to-end trainable architecture that seamlessly integrates convolutional neural networks (CNNs) with bidirectional long short-term memory (BiLSTM) units. The fact that the proposed deep learning model achieved 87.1% sensitivity, 93.3% precision and 99.6% accuracy on the test dataset shows the efficiency of the method for Ottoman character recognition. Performing character recognition with high accuracy in printed Ottoman texts will also provide a strong basis for future alphabet and language translation studies.
Benzer Tezler
- Havayoluyla yapılan uluslararası yük ve yolcu taşıma sözleşmelerinde taşıyıcının sorumluluğu
The liability of the carrier i̇n the contract of i̇nternational air transport of passengers and cargo
EMRE YOLCU
- Ekonomik krizlerin istihdama etkileri: Türkiye örneği
Effects of economi̇cal cri̇si̇s on employment: The Turkey example
ÖMER EREN HENDEK
Yüksek Lisans
Türkçe
2013
EkonomiKırıkkale Üniversitesiİktisat Ana Bilim Dalı
YRD. DOÇ. DR. TANER TAYLAN DOĞAN
- Kardiyopulmoner bypass ile açık kalp cerrahisi uygulanan hastalarda orta ve hafif hipotermik bypass yöntemlerinin neutrophıl gelatınase assocıated lıpocalın (NGAL), cystatın c ve near ınfrared spectroscopy (NIRS) yöntemi ile ölçülen renal perfüzyon üzerine etkilerinin karşılaştırılması
Comparing the effects of mild and moderate hypothermia on renal perfusion evaluated with neutrophil gelatinase associated lipocalin, cystatin c and near-infrared spectroscopy in patients undergoing cardiopulmonary bypass graft surgery
SERKAN YILDIRIM
Tıpta Uzmanlık
Türkçe
2014
Göğüs Kalp ve Damar CerrahisiSelçuk ÜniversitesiKalp ve Damar Cerrahisi Ana Bilim Dalı
DOÇ. DR. MEHMET ALKILIÇ HORASANI ÖÇ
- 1950 sonrası Türk Resim Sanatı'nda soyutlama eğilimleri ve plastik çözümlemeler
Abstracti̇on trends and plasti̇c analysi̇es of after 1950 Turki̇sh Pai̇nti̇ng Art
SABRİYE ÖZTÜTÜNCÜ
- Cinsel yolla bulaşan enfeksiyon etkenlerinin tanısında kullanılan konvansiyonel yöntemler ve DPO TM (dual priming oligonükleotid) tabanlı multipleks PCR yönteminin karşılaştırılması
Comparison of conventional methods used in the diagnosis of sexually transmitted infectionsand DPO TM (Dual priming oligonükletid) based multiplex PCR method
DEMET FURKAN SEVİNDİ
Tıpta Uzmanlık
Türkçe
2013
MikrobiyolojiSağlık BakanlığıTıbbi Mikrobiyoloji Ana Bilim Dalı
DOÇ. DR. BERRİN ESEN