Handwritten character recognition and document analysis using deep neural networks
Derin sinir ağları kullanarak el yazısı algılama ve belge analizi
- Tez No: 625376
- Danışmanlar: DR. ÖĞR. ÜYESİ METEHAN MAKİNACI
- Tez Türü: Yüksek Lisans
- Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2020
- Dil: İngilizce
- Üniversite: Dokuz Eylül Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Elektrik Elektronik Mühendisliği Bilim Dalı
- Sayfa Sayısı: 85
Özet
Bu çalışmada el yazısı kaynak kodu karakterlerini tanımak için derin öğrenme tekniklerinin bir uygulaması sunulmuştur. Her ne kadar el yazısı karakter tanıma problemi üzerine bir çok çalışma olsa da, çevrim dışı el yazısı kaynak kodu karakteri tanımada çok az çalışma bulunmaktadır. Problem kaynak koduna özel karakterleri tanımayı içermektedir. C programa dilinde yazılmış kodlar içeren sınav kağıtları üzerinde önişleme, histogram tabanlı bölütleme ve normalizasyon yapan bir uygulama tasarlanmış ve gerçeklenmiştir. Oluşturulan veri kümesi 7093 kaynak kodu karakter örneği içermektedir. Bu veri kümesi CROHME veri tabanından dönüştürülen çevrim dışı örneklerle zenginleştirilmiştir. Sonuçta oluşan 95 sınıflı 17748 örnek ile bazı Evrişimsel Sinir Ağı (ESA) modelleri eğitildi ve test edildi. ESA el yazısı karakter tanıma görevlerinde en ileri gelişmeleri yansıtan bir derin öğrenme mimarisidir. Deneyler yüzde 92,33 ilâ yüzde 98,82 arasında başarı dereceleri vermiştir. Bununla, CNN tabanlı sınıflandırıcıların el yazısı kaynak kodu tanımada güçlü araçlar olduğu sonucuna varıyoruz.
Özet (Çeviri)
In this work, an application of deep learning techniques to recognize handwritten source code characters is presented. Although there are many works on the handwritten character recognition (HCR) problem, very few have been done about the offline handwritten source code character recognition. The problem includes the recognition of source code specific characters. An application designed and implemented, performing preprocessing, histogram based segmentation and normalization on the scanned documents of exam papers which include codes that were written in C programming language. Constructed dataset includes 7093 source code character samples. This dataset was enriched with character samples from the CROHME database by transforming them to offline samples. With resulting 95 classes of 17748 samples, several models of Convolutional Neural Networks (CNNs) were trained and tested. CNN is a deep learning architecture which is shown to produce state-of-the-art performance rates for handwritten character recognition tasks as in various other computer vision applications. Experimental evaluations gave performance rates between 92.33 percent and 98.82 percent. We conclude that CNN based classifiers are powerful tools for recognition of handwritten source code characters task.
Benzer Tezler
- Design of an offline ottoman character recognition system for translating printed documents to modern turkish
Basılı dökümanların modern türkçeye çevrilmesi için çevrimdışı osmanlıca karakter tanıma sistemi tasarımı
NAZ KÜÇÜKŞAHİN
Yüksek Lisans
İngilizce
2019
Elektrik ve Elektronik Mühendisliğiİzmir Yüksek Teknoloji EnstitüsüElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ MEHMET ZÜBEYİR ÜNLÜ
- İngilizcede çember dolgu oranı yöntemi ile optik karakter tanıma
Optical character recognition with circle filling rate method for English
SAHRA TİLKİ
Yüksek Lisans
Türkçe
2020
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Sabahattin Zaim ÜniversitesiBilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı
DR. YAHYA ŞİRİN
- Doküman kategorizasyonu ve imza bölge analizi
Document categorization and signature region analysis
İLKHAN CÜCELOĞLU
Yüksek Lisans
Türkçe
2014
BankacılıkBaşkent ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. HASAN OĞUL
- An android based receipt tracker system using optical character recognition
Optik karakter algılamaya dayalı android tabanlı fatura takip sistemi
KAREZ HAMAD
Yüksek Lisans
İngilizce
2017
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolFırat ÜniversitesiYazılım Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. MEHMET KAYA
- Süperpiksel tabanlı satır bölütleme
Superpixel based text-line segmentation
ALİ ALPER DEMİR
Yüksek Lisans
Türkçe
2019
Elektrik ve Elektronik MühendisliğiSüleyman Demirel ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ UFUK ÖZKAYA