Geri Dön

Handwritten character recognition and document analysis using deep neural networks

Derin sinir ağları kullanarak el yazısı algılama ve belge analizi

  1. Tez No: 625376
  2. Yazar: BARIŞ KILIÇLAR
  3. Danışmanlar: DR. ÖĞR. ÜYESİ METEHAN MAKİNACI
  4. Tez Türü: Yüksek Lisans
  5. Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2020
  8. Dil: İngilizce
  9. Üniversite: Dokuz Eylül Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Elektrik Elektronik Mühendisliği Bilim Dalı
  13. Sayfa Sayısı: 85

Özet

Bu çalışmada el yazısı kaynak kodu karakterlerini tanımak için derin öğrenme tekniklerinin bir uygulaması sunulmuştur. Her ne kadar el yazısı karakter tanıma problemi üzerine bir çok çalışma olsa da, çevrim dışı el yazısı kaynak kodu karakteri tanımada çok az çalışma bulunmaktadır. Problem kaynak koduna özel karakterleri tanımayı içermektedir. C programa dilinde yazılmış kodlar içeren sınav kağıtları üzerinde önişleme, histogram tabanlı bölütleme ve normalizasyon yapan bir uygulama tasarlanmış ve gerçeklenmiştir. Oluşturulan veri kümesi 7093 kaynak kodu karakter örneği içermektedir. Bu veri kümesi CROHME veri tabanından dönüştürülen çevrim dışı örneklerle zenginleştirilmiştir. Sonuçta oluşan 95 sınıflı 17748 örnek ile bazı Evrişimsel Sinir Ağı (ESA) modelleri eğitildi ve test edildi. ESA el yazısı karakter tanıma görevlerinde en ileri gelişmeleri yansıtan bir derin öğrenme mimarisidir. Deneyler yüzde 92,33 ilâ yüzde 98,82 arasında başarı dereceleri vermiştir. Bununla, CNN tabanlı sınıflandırıcıların el yazısı kaynak kodu tanımada güçlü araçlar olduğu sonucuna varıyoruz.

Özet (Çeviri)

In this work, an application of deep learning techniques to recognize handwritten source code characters is presented. Although there are many works on the handwritten character recognition (HCR) problem, very few have been done about the offline handwritten source code character recognition. The problem includes the recognition of source code specific characters. An application designed and implemented, performing preprocessing, histogram based segmentation and normalization on the scanned documents of exam papers which include codes that were written in C programming language. Constructed dataset includes 7093 source code character samples. This dataset was enriched with character samples from the CROHME database by transforming them to offline samples. With resulting 95 classes of 17748 samples, several models of Convolutional Neural Networks (CNNs) were trained and tested. CNN is a deep learning architecture which is shown to produce state-of-the-art performance rates for handwritten character recognition tasks as in various other computer vision applications. Experimental evaluations gave performance rates between 92.33 percent and 98.82 percent. We conclude that CNN based classifiers are powerful tools for recognition of handwritten source code characters task.

Benzer Tezler

  1. Design of an offline ottoman character recognition system for translating printed documents to modern turkish

    Basılı dökümanların modern türkçeye çevrilmesi için çevrimdışı osmanlıca karakter tanıma sistemi tasarımı

    NAZ KÜÇÜKŞAHİN

    Yüksek Lisans

    İngilizce

    İngilizce

    2019

    Elektrik ve Elektronik Mühendisliğiİzmir Yüksek Teknoloji Enstitüsü

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ MEHMET ZÜBEYİR ÜNLÜ

  2. İngilizcede çember dolgu oranı yöntemi ile optik karakter tanıma

    Optical character recognition with circle filling rate method for English

    SAHRA TİLKİ

    Yüksek Lisans

    Türkçe

    Türkçe

    2020

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Sabahattin Zaim Üniversitesi

    Bilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı

    DR. YAHYA ŞİRİN

  3. Doküman kategorizasyonu ve imza bölge analizi

    Document categorization and signature region analysis

    İLKHAN CÜCELOĞLU

    Yüksek Lisans

    Türkçe

    Türkçe

    2014

    BankacılıkBaşkent Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. HASAN OĞUL

  4. An android based receipt tracker system using optical character recognition

    Optik karakter algılamaya dayalı android tabanlı fatura takip sistemi

    KAREZ HAMAD

    Yüksek Lisans

    İngilizce

    İngilizce

    2017

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolFırat Üniversitesi

    Yazılım Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. MEHMET KAYA

  5. Süperpiksel tabanlı satır bölütleme

    Superpixel based text-line segmentation

    ALİ ALPER DEMİR

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    Elektrik ve Elektronik MühendisliğiSüleyman Demirel Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ UFUK ÖZKAYA