Geri Dön

A Form document image parser

Form döküman görüntüleri için bir ayrıştırıcı

  1. Tez No: 75854
  2. Yazar: EBRU DİNCEL
  3. Danışmanlar: YRD. DOÇ. DR. VOLKAN ATALAY
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 1998
  8. Dil: İngilizce
  9. Üniversite: Orta Doğu Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 60

Özet

Formlar birçok bilgi yönetim sistemlerinde yaygın olarak kullanılmaktadırlar. Dokümanların otomatik olarak işlenmesi sayılarının çokluğu ve formların çeşitliliği nedeniyle, geleneksel yöntemlere tercih edilmelidir. Operatör hatasını, maliyetini ve kullanıcı etkileşimini en aza indirecek bir sistemin geliştirilmesine ihtiyaç vardır. Bu tezde, metin ve metindışı elemanların yeraldığı form dokümanlarının otomatiğe yakın bir şekilde ayrıştırılması için bir sistem önerilmektedir. Bu ayrıştırıcı iki kısımdan oluşmaktadır. İlk kısımda form dokümanı tarama ve önişlemeden geçer; daha sonra ise geometrik tertip çıkarımı için çizgilerin çıkarılması, köşelerin bu lunması ve gözelerin gösterimi gerçekleştirilir. Bir sonraki kısımda ise girdinin örnek ya da model form olmasına göre içerik etiketlenmesi veya metin çıkarımı yapılır. Metin elemanları için yapılan içerik etiketlenmesi, önbaskılı ya da son radan yazılmış olarak, gözetimsiz demetleme aracılığıyla yapılır. Bunu daha sonra model formun ilişkilendirilmesi ve gösterimi takip eder.

Özet (Çeviri)

Forms are used extensively as input to many information management systems. An automatic way of processing a form should be preferred over the traditional manual methods due to high volume and numerous kinds of form documents. A system that minimizes operator error, cost and user interaction has to be developed. In this thesis, a system towards automatically parsing form documents that have textual and nontextual elements is proposed. The parser involves two parts. In the first part, the form document goes through scan and preprocessing steps; then line extraction, vertex identification and cell representation are carried out for geometric layout extraction. In the next part, depending on whether an instance or a model form is input, content labelling or text extraction is done. Content labelling among textual elements, i.e. preprinted or user filled- in, is performed based on an unsupervised clustering. This is followed by the association and representation of the model form.

Benzer Tezler

  1. Diasporanın sembolik sermayesi: Atina'da yaşayan İstanbullu Rumların aile fotoğrafları

    The symbolic capital of the diaspora: Family photographs of the Rum Istanbulites of Athens

    CEREN ACUN

    Doktora

    Türkçe

    Türkçe

    2021

    AntropolojiGalatasaray Üniversitesi

    Radyo Televizyon ve Sinema Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ Ö. MURAD ÖZDEMİR

  2. Batum Burunbaşı Mevkii'nde Aziziye şehrinin kuruluşu, mimarisi ve Osmanlı Dönemi yapıları (1864-1878)

    The establishment, architecture and Ottoman buildings of the city Aziziye in Burunbasi district of Batumi (1864-1878)

    SELMA SALTOĞLU

    Yüksek Lisans

    Türkçe

    Türkçe

    2016

    Mimarlıkİstanbul Teknik Üniversitesi

    Mimarlık Ana Bilim Dalı

    DOÇ. DR. AYGÜL AĞIR

  3. An SGML viewer for form document images

    Form dökümanlar için SGML göstericisi

    ERKAN ARSLAN

    Yüksek Lisans

    İngilizce

    İngilizce

    1998

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. VOLKAN ATALAY

  4. The Performance evaluation of low level algorithms for document processing

    Belge işleme alt düzey algoritmalarının başarım değerlendirmesi

    ALİ TOYGAR ABAK

    Yüksek Lisans

    İngilizce

    İngilizce

    1998

    Elektrik ve Elektronik MühendisliğiBoğaziçi Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    PROF. DR. MEHMET BÜLENT SANKUR

  5. Handwritten text recognition using deep learning

    Derin öğrenme ile el yazısı metin tanıma

    USAMA MUNIR

    Yüksek Lisans

    İngilizce

    İngilizce

    2019

    Elektrik ve Elektronik MühendisliğiKaradeniz Teknik Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ MEHMET ÖZTÜRK