Doküman analiz/anlama ve optik karakter tanıma sistemi
Document analysis/understanding and optical character recognition system
- Tez No: 66038
- Danışmanlar: PROF. DR. M. ÜMİT KARAKAŞ
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 1997
- Dil: Türkçe
- Üniversite: Hacettepe Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Bilimleri Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 204
Özet
DOKÜMAN ANALİZ-ANLAMA VE OPTİK KARAKTER TANIMA SİSTEMİ BÜLENT DURAK ÖZET Gerçek ortamda Optik Karakter Tanıma (OKT) sorunu, kutulanmış ve sabit bir boyuta getirilmiş karakterlerin yüksek tanıma hızı ve oranı ile tanınması sorunu değildir. Doküman içerisindeki karakterlerin kutulanarak karakter tanıma modüllerine sunulması aşamasından önce çözülmesi gereken sorunlar şunlardır: Doküman görüntüsündeki gürültülerin temizlenmesi, tarama çarpıklığının tespit edilip varsa düzeltilmesi, doküman içerisindeki blokların bulunması, blokların türlerine göre sınıflandırılması, sütun başlangıç konumlarının bulunması ve blokların mantıksal işleniş sırasının bulunması, satırların değişik punto boylan ile bulunması işlemlerinin karakter tanıma aşamasından önce gerçekleştirilmesi gereklidir. Karakterlerin tanınması ancak bu işlem adımlarından sonra mümkün olmaktadır. Karakterlerin tanınması aşamasındaki başarını önceki işlem adımlarında elde edilen başarımdan doğrudan etkilenmektedir. Tüm bu işlemleri gerçekleştiren bir sistem. Doküman Analiz-Anlama ve Optik Karakter Tanıma Sistemleri olarak adlandırılmaktadır. Bu tez çalışmasında, temel olarak A4 boyutunda 300x300 dpi çözünürlük ile taranmış, karmaşık sayfa düzenindeki dokümanları otomatik olarak işleyebilen komple bir Doküman Analiz-Anlama ve Optik Karakter Tanıma Yazılımı mikrobilgisayar ortamında yüksek tanıma yüzdesi, yüksek tarama hızı ve en az donanım ihtiyacı amaçlanarak geliştirilmiştir. Tez çalışması kapsamında geliştirilen yazılım OKU s.2.0 Doküman Analiz-Anlama ve Optik Karakter Tanıma Yazılımı olarak adlandırılmaktadır. Geliştirilen yazdım doküman görüntüsündeki tarama çarpıklıklarını otomatik olarak tespit edip düzeltebilmekte, birden fazla sütun içeren dokümanlar içerisindeki blokların pozisyonlarını doğru olarak tespit edebilmekte, bulunan bloklarımetin, resim/grafik/çizelge, yatay çizgi ve dikey çizgi olarak sınıflandırabilmekte, blokların mantıksal işleniş sırasını bulabilmekte, bulunan bloklardan metin blokları içerisindeki italik yazım biçimindeki karakterlerde dahil olmak üzere kutulayabilmekte, kutulanan karakterler bu tez kapsamında geliştirilen bir tanıma algoritması ile tanınmakta, ilk aşamada doğru olarak tanınamama olasılığı olan karakter alt kümeleri düşünülen karakterler geri yayılımlı yapay sinir ağları ile tanınmakta, tanınan karakterler metin formatında (Code Page 857 formatında) diske saklanabilmektedir. Yazdım ile farklı Latin alfabe dillerin karakterlerini içeren 357 adet karakter sadece bir tanıma modülü ile tanınmaktadır. Optik Karakter Tanıma Yazılımı, iyi kaliteli Türkçe dokümanlarda %96.3 oranında başarı saptanmıştır. Anahtar Sözcükler : Optik Karakter Tanıma, Doküman Analiz ve Anlama, Tarama Çarpıklığı, Yapay Sinir Ağiarı
Özet (Çeviri)
DOCUMENT ANALYSIS-ÜNDERSTANDING AıND OPT1CAL CHARACTER RECOGNITION SYSTEM BÜLENT DURAK ABSTRACT Optical Character Recognition (OCR) is not only the study of recognizing characters, that are boxed and normalized to a fixed pixel size, wilh high recognition rate and speed. Some of the problems muş t be solved before Opticai Character Recognition phase (OCR phase) are eliminating noises in the document images, determining and eliminating scanning skew, finding positions of the blocks in the document, discriminating blocks according to their features such as text and picture/graphics/table biocks and determining tiıe block hierarchy of the document. The OCR phase can be done after preceeding steps. The performance of the OCR modüle is dependent on the performance of preceeding steps. A system, that is capabie of solve these problems, is named as Document Analysis-Understanding and Optical Character Recognition System. in tlıis study, the implementation of a completely automatic Document Anaiysis- Understanding and Opticai Character Recognition Software System which is developed primarily for document images with complex page iayouts. For this implementation, image size of A4 and resolution of 300x300 dpi, is preferred. The software, that is redesigned and impJemented in this study, is naraed as OKU v.2.0 Document Analysis-Understanding and Optical Character Recognition Software. The implemented software can detect and eliminate scanning skevv; fınd positions of the blocks; discriminate text, picture/graphics/table, horizontal line, and vertical line regions; understand the block hierarchy of the document; identify (boxing) characters even in Italic style, normalizc pixel size and recognize characters using a recognition algorithm. A fevv character groups, that may be misrecognized, are recognized using Arlificial Neural Nctvvorks (ANN). Thus, final performance is increascd. The recognized characters are storccl in this vvith text format (using Code Page 857character set). In this working, totally 157 latin characters of different languages can be recognized with only one recognition module. Optical Character Recognition System can reach 96.3% recognition rate with good quality Turkish documents Keywords : Optical Character Recognition, Document Analysis and Understanding, Scanning Skew, Artificial Neural Networks JV
Benzer Tezler
- Telekomünikasyon sektöründe veri toplama yöntemleri, yeni yaklaşımlar ve güvenlik
Data collection methods in the telecommunication sector, new approaches and safety
EMİNE HEMŞİNLİ
Yüksek Lisans
Türkçe
2015
Bilgi ve Belge YönetimiGediz ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
PROF. DR. MUSTAFA GÜNEŞ
- Event extraction from Turkish Trade Registry Gazette
Türkiye Ticaret Sicili Gazetesi'nden olay çıkarımı
İREM NUR DEMİRTAŞ
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. GÜLŞEN ERYİĞİT
- Derin öğrenme ile cerrahi video anlama
Surgical video understanding with deep learning
ABDISHAKOUR ABDILLAHI AWALE ABDISHAKOUR ABDILLAHI AWALE
Yüksek Lisans
İngilizce
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi ÜniversitesiBilişim Sistemleri Ana Bilim Dalı
DR. ÖĞR. ÜYESİ DUYGU SARIKAYA
- Assessment of properties and mechanical behavior of novel Al/Mg cast alloys
Yeni nesil Al/Mg dökme alaşımlarının özelliklerinin ve mekanik davranışının değerlendirilmesi
KAMİL ARMAĞAN GÜL
Doktora
İngilizce
2024
Metalurji Mühendisliğiİstanbul Teknik ÜniversitesiMetalurji ve Malzeme Mühendisliği Ana Bilim Dalı
PROF. DR. EYÜP SABRİ KAYALI
PROF. DR. ÖZGÜR ASLAN
- Detection of human vital signs through obstructive barriers using UWB GPR
Engel arkası hayati bulguların geniş bantlı yere nüfus eden radar ile tespiti
CANSU BÜYÜKHAN
Yüksek Lisans
İngilizce
2017
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
PROF. DR. FATMA İNCİ ÇİLESİZ
YRD. DOÇ. DR. SAEID KARAMZADEH