Geri Dön

Doküman analiz/anlama ve optik karakter tanıma sistemi

Document analysis/understanding and optical character recognition system

  1. Tez No: 66038
  2. Yazar: BÜLENT DURAK
  3. Danışmanlar: PROF. DR. M. ÜMİT KARAKAŞ
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 1997
  8. Dil: Türkçe
  9. Üniversite: Hacettepe Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Bilimleri Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 204

Özet

DOKÜMAN ANALİZ-ANLAMA VE OPTİK KARAKTER TANIMA SİSTEMİ BÜLENT DURAK ÖZET Gerçek ortamda Optik Karakter Tanıma (OKT) sorunu, kutulanmış ve sabit bir boyuta getirilmiş karakterlerin yüksek tanıma hızı ve oranı ile tanınması sorunu değildir. Doküman içerisindeki karakterlerin kutulanarak karakter tanıma modüllerine sunulması aşamasından önce çözülmesi gereken sorunlar şunlardır: Doküman görüntüsündeki gürültülerin temizlenmesi, tarama çarpıklığının tespit edilip varsa düzeltilmesi, doküman içerisindeki blokların bulunması, blokların türlerine göre sınıflandırılması, sütun başlangıç konumlarının bulunması ve blokların mantıksal işleniş sırasının bulunması, satırların değişik punto boylan ile bulunması işlemlerinin karakter tanıma aşamasından önce gerçekleştirilmesi gereklidir. Karakterlerin tanınması ancak bu işlem adımlarından sonra mümkün olmaktadır. Karakterlerin tanınması aşamasındaki başarını önceki işlem adımlarında elde edilen başarımdan doğrudan etkilenmektedir. Tüm bu işlemleri gerçekleştiren bir sistem. Doküman Analiz-Anlama ve Optik Karakter Tanıma Sistemleri olarak adlandırılmaktadır. Bu tez çalışmasında, temel olarak A4 boyutunda 300x300 dpi çözünürlük ile taranmış, karmaşık sayfa düzenindeki dokümanları otomatik olarak işleyebilen komple bir Doküman Analiz-Anlama ve Optik Karakter Tanıma Yazılımı mikrobilgisayar ortamında yüksek tanıma yüzdesi, yüksek tarama hızı ve en az donanım ihtiyacı amaçlanarak geliştirilmiştir. Tez çalışması kapsamında geliştirilen yazılım OKU s.2.0 Doküman Analiz-Anlama ve Optik Karakter Tanıma Yazılımı olarak adlandırılmaktadır. Geliştirilen yazdım doküman görüntüsündeki tarama çarpıklıklarını otomatik olarak tespit edip düzeltebilmekte, birden fazla sütun içeren dokümanlar içerisindeki blokların pozisyonlarını doğru olarak tespit edebilmekte, bulunan bloklarımetin, resim/grafik/çizelge, yatay çizgi ve dikey çizgi olarak sınıflandırabilmekte, blokların mantıksal işleniş sırasını bulabilmekte, bulunan bloklardan metin blokları içerisindeki italik yazım biçimindeki karakterlerde dahil olmak üzere kutulayabilmekte, kutulanan karakterler bu tez kapsamında geliştirilen bir tanıma algoritması ile tanınmakta, ilk aşamada doğru olarak tanınamama olasılığı olan karakter alt kümeleri düşünülen karakterler geri yayılımlı yapay sinir ağları ile tanınmakta, tanınan karakterler metin formatında (Code Page 857 formatında) diske saklanabilmektedir. Yazdım ile farklı Latin alfabe dillerin karakterlerini içeren 357 adet karakter sadece bir tanıma modülü ile tanınmaktadır. Optik Karakter Tanıma Yazılımı, iyi kaliteli Türkçe dokümanlarda %96.3 oranında başarı saptanmıştır. Anahtar Sözcükler : Optik Karakter Tanıma, Doküman Analiz ve Anlama, Tarama Çarpıklığı, Yapay Sinir Ağiarı

Özet (Çeviri)

DOCUMENT ANALYSIS-ÜNDERSTANDING AıND OPT1CAL CHARACTER RECOGNITION SYSTEM BÜLENT DURAK ABSTRACT Optical Character Recognition (OCR) is not only the study of recognizing characters, that are boxed and normalized to a fixed pixel size, wilh high recognition rate and speed. Some of the problems muş t be solved before Opticai Character Recognition phase (OCR phase) are eliminating noises in the document images, determining and eliminating scanning skew, finding positions of the blocks in the document, discriminating blocks according to their features such as text and picture/graphics/table biocks and determining tiıe block hierarchy of the document. The OCR phase can be done after preceeding steps. The performance of the OCR modüle is dependent on the performance of preceeding steps. A system, that is capabie of solve these problems, is named as Document Analysis-Understanding and Optical Character Recognition System. in tlıis study, the implementation of a completely automatic Document Anaiysis- Understanding and Opticai Character Recognition Software System which is developed primarily for document images with complex page iayouts. For this implementation, image size of A4 and resolution of 300x300 dpi, is preferred. The software, that is redesigned and impJemented in this study, is naraed as OKU v.2.0 Document Analysis-Understanding and Optical Character Recognition Software. The implemented software can detect and eliminate scanning skevv; fınd positions of the blocks; discriminate text, picture/graphics/table, horizontal line, and vertical line regions; understand the block hierarchy of the document; identify (boxing) characters even in Italic style, normalizc pixel size and recognize characters using a recognition algorithm. A fevv character groups, that may be misrecognized, are recognized using Arlificial Neural Nctvvorks (ANN). Thus, final performance is increascd. The recognized characters are storccl in this vvith text format (using Code Page 857character set). In this working, totally 157 latin characters of different languages can be recognized with only one recognition module. Optical Character Recognition System can reach 96.3% recognition rate with good quality Turkish documents Keywords : Optical Character Recognition, Document Analysis and Understanding, Scanning Skew, Artificial Neural Networks JV

Benzer Tezler

  1. Telekomünikasyon sektöründe veri toplama yöntemleri, yeni yaklaşımlar ve güvenlik

    Data collection methods in the telecommunication sector, new approaches and safety

    EMİNE HEMŞİNLİ

    Yüksek Lisans

    Türkçe

    Türkçe

    2015

    Bilgi ve Belge YönetimiGediz Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    PROF. DR. MUSTAFA GÜNEŞ

  2. Event extraction from Turkish Trade Registry Gazette

    Türkiye Ticaret Sicili Gazetesi'nden olay çıkarımı

    İREM NUR DEMİRTAŞ

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. GÜLŞEN ERYİĞİT

  3. Derin öğrenme ile cerrahi video anlama

    Surgical video understanding with deep learning

    ABDISHAKOUR ABDILLAHI AWALE ABDISHAKOUR ABDILLAHI AWALE

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi Üniversitesi

    Bilişim Sistemleri Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ DUYGU SARIKAYA

  4. Assessment of properties and mechanical behavior of novel Al/Mg cast alloys

    Yeni nesil Al/Mg dökme alaşımlarının özelliklerinin ve mekanik davranışının değerlendirilmesi

    KAMİL ARMAĞAN GÜL

    Doktora

    İngilizce

    İngilizce

    2024

    Metalurji Mühendisliğiİstanbul Teknik Üniversitesi

    Metalurji ve Malzeme Mühendisliği Ana Bilim Dalı

    PROF. DR. EYÜP SABRİ KAYALI

    PROF. DR. ÖZGÜR ASLAN

  5. Detection of human vital signs through obstructive barriers using UWB GPR

    Engel arkası hayati bulguların geniş bantlı yere nüfus eden radar ile tespiti

    CANSU BÜYÜKHAN

    Yüksek Lisans

    İngilizce

    İngilizce

    2017

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    PROF. DR. FATMA İNCİ ÇİLESİZ

    YRD. DOÇ. DR. SAEID KARAMZADEH