Geri Dön

Derin öğrenme ile iki boyutlu optik karakter tanıma

2D optical character recognition based on deep learning

  1. Tez No: 475221
  2. Yazar: EMİN AFŞİN
  3. Danışmanlar: YRD. DOÇ. DR. ARİF KOYUN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2017
  8. Dil: Türkçe
  9. Üniversite: Süleyman Demirel Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 49

Özet

Bu tezin amacı görüntülerdeki optik karakterleri derin öğrenme ile tanımayı sağlamaktır. Görüntülerdeki karakterleri tanıyabilmek için öncelikle her bir karakteri bağımsız olarak ayırmak gerekir. Daha sonra birbirinden ayrılmış karakterleri tanıma işlemine geçilerek işlem bitirilmiş olur. Bu çalışmada karakterlerin tanınmasındaki başarıyı artırmak için yaklaşık olarak 2.160.000 karakter örneği ile derin öğrenmenin özelleşmiş bir yapısı olan Evrişimsel Sinir Ağı eğitilmiştir. Ayrıca ağı eğitme işlemi CPU'larda çok fazla zaman aldığından bilgisayarın GPU'su işlemi hızlandırmak için kullanılmıştır. Karakterleri bağımsız olarak ayırma işlemi için birbirlerine bağlı komponentler tespit edilerek bulunmaya çalışılmıştır. Bu işlem ile birbirinden bağımsız iki veya üç komponente sahip olan i, İ, ü, Ü, ö, Ö, ğ ve Ğ karakterlerinin tespitinin zor olduğu gözlemlenmiştir. Ayrıca w, i, c, ç, o, ö, u, ü vb harflerin büyük ve küçük olanları birbirine benzerlik gösterdiğinden bu harflerin büyük ve küçük olanlarını tespit etmek için harflerin satırın üstüne yakınlığına göre yakın olanlar büyük harf uzak olanlar ise küçük harf olarak tespit edilmeye çalışılmıştır. Bu çalışma Matlab ortamında yapılmıştır.Bu nedenle Matlab Ortamında gömülü olarak çalışan OCR ile hız karşılaştırması yapılmış olup genel olarak satır sayısı fazla olan belgelerde, yapılan uygulama paralel işleme uygun yapıldığından diğer OCR'den daha hızlı çalışığı tespit edilmiştir.

Özet (Çeviri)

This thesis aims to recognize the optical characters in the aimed images by deep learning. In order to recognize the characters in the images, firstly we have to separate each character separately. After that, the process is finished by going to recognize the characters which are separated from each other. In this study, the Convolutional Neural Network, a specialized structure of deep learning with about 2,160,000 character examples, was trained to improve the recognition of characters. The computer's GPU was used to speed up the processing of the computer since it only took a long time to train the network. It has been observed that it is difficult to determine the characters i, ü, ü, Ü, ö, Ö, ğ and Ğ which have two or three independent components with this process. Also, since the letters w, i, c, ç, o, u, etc. are similar to each other, in order to identify the letters big and small, letters near to the line nearest to the line are not to be capitalized It was studied. This work was done in Matlab environment. Because of this, speed comparison was made with OCR which is embedded in Matlab. In general, documents with more rows were found to work faster than other OCR because the application was done in parallel.

Benzer Tezler

  1. Human activity recognition using deep learning

    Derin öğrenme ile insan aktivitesi tanıma

    MURAT YALÇIN

    Yüksek Lisans

    İngilizce

    İngilizce

    2018

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ HÜLYA YALÇIN

  2. Metrik öğrenme yöntemiyle deniz platformu konumlarının radar ve optik görüntüler üzerinden tahmin edilmesi

    Ship location estimation from radar and optic images using metric learning

    MUHAMMED MARUF KILIÇ

    Yüksek Lisans

    Türkçe

    Türkçe

    2018

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGebze Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. YUSUF SİNAN AKGÜL

  3. Optical classification and reconstruction through multimode fibers

    Çok modlu fiberler üzerinden optik sınıflandırma ve yeniden oluşturma

    ŞAHİN KÜREKCİ

    Doktora

    İngilizce

    İngilizce

    2022

    Fizik ve Fizik MühendisliğiOrta Doğu Teknik Üniversitesi

    Fizik Ana Bilim Dalı

    DOÇ. DR. EMRE YÜCE

  4. Joint calibration and reconstruction for focal plane array imaging

    Odak düzlemi dizisi görüntüleme için birleşik kalibrasyon ve geriçatım

    MUHAMMET UMUT BAHÇECİ

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    PROF. DR. ENDER METE EKŞİOĞLU

  5. A social navigation approach for mobile assistant robots

    Asistan mobil robotlar için sosyal bir navigasyon yaklaşımı

    HASAN KIVRAK

    Doktora

    İngilizce

    İngilizce

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. HATİCE KÖSE