PC Based optical character recognition
PC'ye dayalı optik karakter tanıma
- Tez No: 38552
- Danışmanlar: Y.DOÇ.DR. M. METE BULUT
- Tez Türü: Yüksek Lisans
- Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
- Anahtar Kelimeler: Smoothing, Thinning, Contour Following, Normalization, Segmentation, Zone Detection, Preclassification, Document Skew Angle, Mixed Image Segmentation, Geometrical and Topological Features, Recognition
- Yıl: 1995
- Dil: İngilizce
- Üniversite: Orta Doğu Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Belirtilmemiş.
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 155
Özet
öz PC ' YE DAYALI OPTİK KARAKTER TANIMA ÜÇÜNCÜ, Abdülkadir Yüksek Lisans Tezi, Elektrik ve Elektronik Mühendisliği Ana Bilim Dalı Tez Yöneticisi : Yr. Doç. Dr. M. Mete Bulut Ocak, 1995, 155 sayfa Bu tezde, bir Optik Karakter Tanıma işlemi ile, literatürde yer alan bazı ön işlem yöntemlerinin uygulanması sunulmaktadır. Optik Karakter Tanıma işleminin hemen hemen her aşaması hakkında literatürde yer alan yöntemler referansları ile birlikte gelecekteki araştırmacılara kaynak olması açısından verilmiştir. Dört farklı temizleme işlemi ile yedi farklı inceltme işlemi denenmiştir. Kenar bulma filtreleri, laplace işlemcisi ile 4- ve 8- komşulu sınır bulma, çevre bulma, zincir kodu, taşıma ve boyuttan bağımsız dönüşüm gibi yöntemler incelenmiştir. Ana uygulama satır ve karakter ayırımı, doküman açısının düzeltilmesi, temizleme, inceltme, satırda bölge bulma, önsınıflama, metin, resim, tablo ayırımı, paragraf ve başlık ayırımı ve son olarak da tanıma işlemlerinden oluşmaktadır.Tanıma işleminde bulunma süresi çok kısa olan düşük seviyeli özelliklerin (Bitim Noktası, Çatal Noktası, Kesişme Noktası) daha önce kullanılmasına dayalı örgün bir kontrol yapısı uygulanmaktadır. Bu yapı düşük seviyeli özellikler aday karakter grubunu azaltana kadar yüksek seviyeli özelliklerin (kesit alma, boşluk bölgeleri, gibi) kullanımının ertelenmesini içermektedir. Bitişik karakterler çıkartıldığında tanıma oranı 94% ' ün üstünde, bitişik karakterler ile ise 90% ' in üstünde çıkmaktadır. Sözlükden kontrol etme gibi yöntemlerin kullanılmadığı da düşünülürse, sonuçları ümit verici olarak değerlendirebiliriz. Anahtar Kelimeler : Temizleme, İnceltme, Çevre Bulma, Normalleştirmek, Ayırma, Bölge Bulma, Önsınıflama, Doküman Eğim Açısı, Karışık Görüntü Ayırımı, Geometriksel ve Duruma Göre Değişmeyen özellikler, Tanıma Bilim Dalı Kodu: 619.02.05 vı
Özet (Çeviri)
ABSTRACT PC BASED OPTICAL CHARACTER RECOGNITION ÜÇÜNCÜ, Abdülkadir M. S. Electrical and Electronics Engineering Supervisor : Assist. Prof. Dr. M. Mete Bulut January, 1995, 155 Pages In this thesis, implementation of an Optical Character Recognition (OCR) system and also some preprocessing algorithms from the literature are presented. Different methods about almost every concept of OCR and their references are also given as a guide for the future researchers. Four different smoothing and seven different thinning methods are studied. Edge detection operators, 4- and 8- neighborhood boundary finding by Laplace operators, contour following, chain coding, scale and translational invariancy transform, normalization methods are implemented. The implementation consists of the steps: line and character segmentation, document skew angle correction, smoothing, thinning, zone detection, preclassification, text, image, graphic extraction, text block, header discrimination, and recognition step. mIn the recognition step, a hierarchical control structure involving the usage of some low level features ( End Point, Branch Point, Cross Point) which require a minimum amount of processing time for extraction is performed. In this structure, the extraction of high level features (cross sections, gap locations etc.) is postponed until the low level features are identified and used to reduce the candidate set. The recognition rate excluding connected characters is above 94% and including connected characters is above 90%. Since we did not use post-processing like dictionary look up tables, this is an encouraging result.
Benzer Tezler
- Search in classroom videos with optical character recognition for virtual learning
Başlık çevirisi yok
TAYFUN TUNA
- Implementation of a PC based character recognition system
Başlık çevirisi yok
MURAT SÜLEYMAN BÖLÜKBAŞI
Yüksek Lisans
İngilizce
1990
Elektrik ve Elektronik MühendisliğiOrta Doğu Teknik ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. M. METE BULUT
- Segmentation, feature extraction and recognition of ottoman script
Osmanlıca metinin bölütlenmesi, öznitelik çıkarımı ve tanınması
ALPER ATICI
Yüksek Lisans
İngilizce
1994
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. FATOŞ YARMAN VURAL
- Naftoksi veya kinolinoksi grupları içeren yeni hegzadeka sübstitüe ftalosiyaninler
Novel hexadeca substituted phthalocyanines containing naphthoxy or quinolinoxy groups
ÖZGE KURT
- Carborane and metallocarborane functionalized phthalocyanines
Karboran ve metalokarboran fonksiyonlu ftalosyaninler
ILGIN NAR