Geri Dön

PC Based optical character recognition

PC'ye dayalı optik karakter tanıma

  1. Tez No: 38552
  2. Yazar: ABDULKADİR ÜÇÜNCÜ
  3. Danışmanlar: Y.DOÇ.DR. M. METE BULUT
  4. Tez Türü: Yüksek Lisans
  5. Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
  6. Anahtar Kelimeler: Smoothing, Thinning, Contour Following, Normalization, Segmentation, Zone Detection, Preclassification, Document Skew Angle, Mixed Image Segmentation, Geometrical and Topological Features, Recognition
  7. Yıl: 1995
  8. Dil: İngilizce
  9. Üniversite: Orta Doğu Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Belirtilmemiş.
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 155

Özet

öz PC ' YE DAYALI OPTİK KARAKTER TANIMA ÜÇÜNCÜ, Abdülkadir Yüksek Lisans Tezi, Elektrik ve Elektronik Mühendisliği Ana Bilim Dalı Tez Yöneticisi : Yr. Doç. Dr. M. Mete Bulut Ocak, 1995, 155 sayfa Bu tezde, bir Optik Karakter Tanıma işlemi ile, literatürde yer alan bazı ön işlem yöntemlerinin uygulanması sunulmaktadır. Optik Karakter Tanıma işleminin hemen hemen her aşaması hakkında literatürde yer alan yöntemler referansları ile birlikte gelecekteki araştırmacılara kaynak olması açısından verilmiştir. Dört farklı temizleme işlemi ile yedi farklı inceltme işlemi denenmiştir. Kenar bulma filtreleri, laplace işlemcisi ile 4- ve 8- komşulu sınır bulma, çevre bulma, zincir kodu, taşıma ve boyuttan bağımsız dönüşüm gibi yöntemler incelenmiştir. Ana uygulama satır ve karakter ayırımı, doküman açısının düzeltilmesi, temizleme, inceltme, satırda bölge bulma, önsınıflama, metin, resim, tablo ayırımı, paragraf ve başlık ayırımı ve son olarak da tanıma işlemlerinden oluşmaktadır.Tanıma işleminde bulunma süresi çok kısa olan düşük seviyeli özelliklerin (Bitim Noktası, Çatal Noktası, Kesişme Noktası) daha önce kullanılmasına dayalı örgün bir kontrol yapısı uygulanmaktadır. Bu yapı düşük seviyeli özellikler aday karakter grubunu azaltana kadar yüksek seviyeli özelliklerin (kesit alma, boşluk bölgeleri, gibi) kullanımının ertelenmesini içermektedir. Bitişik karakterler çıkartıldığında tanıma oranı 94% ' ün üstünde, bitişik karakterler ile ise 90% ' in üstünde çıkmaktadır. Sözlükden kontrol etme gibi yöntemlerin kullanılmadığı da düşünülürse, sonuçları ümit verici olarak değerlendirebiliriz. Anahtar Kelimeler : Temizleme, İnceltme, Çevre Bulma, Normalleştirmek, Ayırma, Bölge Bulma, Önsınıflama, Doküman Eğim Açısı, Karışık Görüntü Ayırımı, Geometriksel ve Duruma Göre Değişmeyen özellikler, Tanıma Bilim Dalı Kodu: 619.02.05 vı

Özet (Çeviri)

ABSTRACT PC BASED OPTICAL CHARACTER RECOGNITION ÜÇÜNCÜ, Abdülkadir M. S. Electrical and Electronics Engineering Supervisor : Assist. Prof. Dr. M. Mete Bulut January, 1995, 155 Pages In this thesis, implementation of an Optical Character Recognition (OCR) system and also some preprocessing algorithms from the literature are presented. Different methods about almost every concept of OCR and their references are also given as a guide for the future researchers. Four different smoothing and seven different thinning methods are studied. Edge detection operators, 4- and 8- neighborhood boundary finding by Laplace operators, contour following, chain coding, scale and translational invariancy transform, normalization methods are implemented. The implementation consists of the steps: line and character segmentation, document skew angle correction, smoothing, thinning, zone detection, preclassification, text, image, graphic extraction, text block, header discrimination, and recognition step. mIn the recognition step, a hierarchical control structure involving the usage of some low level features ( End Point, Branch Point, Cross Point) which require a minimum amount of processing time for extraction is performed. In this structure, the extraction of high level features (cross sections, gap locations etc.) is postponed until the low level features are identified and used to reduce the candidate set. The recognition rate excluding connected characters is above 94% and including connected characters is above 90%. Since we did not use post-processing like dictionary look up tables, this is an encouraging result.

Benzer Tezler

  1. Implementation of a PC based character recognition system

    Başlık çevirisi yok

    MURAT SÜLEYMAN BÖLÜKBAŞI

    Yüksek Lisans

    İngilizce

    İngilizce

    1990

    Elektrik ve Elektronik MühendisliğiOrta Doğu Teknik Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. M. METE BULUT

  2. Segmentation, feature extraction and recognition of ottoman script

    Osmanlıca metinin bölütlenmesi, öznitelik çıkarımı ve tanınması

    ALPER ATICI

    Yüksek Lisans

    İngilizce

    İngilizce

    1994

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. FATOŞ YARMAN VURAL

  3. Naftoksi veya kinolinoksi grupları içeren yeni hegzadeka sübstitüe ftalosiyaninler

    Novel hexadeca substituted phthalocyanines containing naphthoxy or quinolinoxy groups

    ÖZGE KURT

    Doktora

    Türkçe

    Türkçe

    2015

    Kimyaİstanbul Teknik Üniversitesi

    Kimya Ana Bilim Dalı

    PROF. DR. MAKBULE KOÇAK

  4. Carborane and metallocarborane functionalized phthalocyanines

    Karboran ve metalokarboran fonksiyonlu ftalosyaninler

    ILGIN NAR

    Doktora

    İngilizce

    İngilizce

    2017

    Kimyaİstanbul Teknik Üniversitesi

    Kimya Ana Bilim Dalı

    PROF. DR. ESİN HAMURYUDAN