Geri Dön

İngilizcede çember dolgu oranı yöntemi ile optik karakter tanıma

Optical character recognition with circle filling rate method for English

  1. Tez No: 689747
  2. Yazar: SAHRA TİLKİ
  3. Danışmanlar: DR. YAHYA ŞİRİN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: OCR, Görüntü İşleme, Nesne Tanıma, Derin Öğrenme, CNN, OCR, Image Processing, Object Recognition, Deep Learning, CNN
  7. Yıl: 2020
  8. Dil: Türkçe
  9. Üniversite: İstanbul Sabahattin Zaim Üniversitesi
  10. Enstitü: Lisansüstü Eğitim Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Bilgisayar Bilimi ve Mühendisliği Bilim Dalı
  13. Sayfa Sayısı: 99

Özet

Çeşitli alanlarda, mevcut olan verilerden bilgisayar ortamına bilgi depolaması yapabilmek, el yazısıyla yazılmış veya basılı dokümanlarda bulunan bilgileri, bilgisayarlar aracılığıyla tekrar kullanabilmek için fazla talep bulunmaktadır. Ancak bu bilgilerin olduğu belge veya dosyaları yeniden kullanabilmek, saklayabilmek için, bilgilerin okunması ve sorgulanması gerekmektedir. Bu nedenler doğrultusunda görüntü dosyalarından, özellikle de metinlerdeki bilgileri otomatik olarak alma ve depolama tekniklerine ihtiyaç vardır. Optik Karakter Tanıma (OCR), görüntülerden otomatik olarak metin çıkarma ve işleme yeteneğine sahip bir bilgisayar sistemi geliştirmeye çalışan, son yıllarda araştırmacıların ilgisini çeken aktif bir araştırma alanıdır. OCR' nın amacı, herhangi bir metin biçiminde veya el yazısı içeren belgelerde değişiklik veya dönüşüm elde etmektir. Bu sayede daha derin ve daha ileri işlemler için yazdırılabilir veya taranmış metin görüntüleri, dijital formatta düzenlenebilir ve saklanabilir. Görüntüdeki karakterlerin doğru tanınması için görüntü üzerinde var olan çeşitli bozukluklar, karakterlerin font özellikleri, ışık miktarı, gibi birçok etkenin düzenlenmesi gerekmektedir. Bu nedenle kullanılacak görüntüler üzerinde gürültü azaltma, rotasyon düzeltme, ikili hale getirme ve normalizasyon gibi çeşitli görüntü işleme teknikleri uygulamak gerekir. Yapılan bu işlemler, sonraki aşamalarda karşılaşılabilecek zorluklara çözüm olup, doğru tanıma yapabilmek açısından oldukça önemli bir yere sahiptir. Bu çalışmada, iskelet temsilini baz alan bir yöntem olan Çember Dolgu Oranı yönteminden elde edilen bilgiler ile derin öğrenme tekniklerinden biri olan CNN(Konvolüsyonel Sinir Ağı) modelinin birlikte kullanılmasının sonucunda daha az veri ile tanıma hızının artırılması ve yüksek doğruluk oranında tanıma amaçlanmaktadır. Çalışmada kullanılan görüntüler, Matlab platformunda gerekli görüntü işleme teknikleri uygulanarak oluşturulan CNN modelinde eğitim için kullanılmak üzere hazır hale getirilmiştir. İlk aşamada CNN modelinde girdi olarak karakter görüntüleri kullanılmıştır. Daha sonra iskelet temsilleri oluşturulan görüntülerin, iskelet noktalarıyla ve Çember Dolgu Oranı yöntemi ile elde edilen noktalara PCA (Temel Bileşenler Analizi) işlemi uygulanarak görsel biçimde kullanılması sağlanmış ve bu işlemle birlikte yeni görüntüler elde edilmiştir. Bu görüntüler aynı CNN modelinde kullanılıp eğitim yapılmıştır. Gerçekleştirilen eğitimler sonucunda ulaşılan test sonuçlarının doğruluk oranları arasında performans kıyaslamaları yapılmış ve deneysel çalışmalarla sonuçları sunulmuştur.

Özet (Çeviri)

There is a lot of demand to be able to store information from the data available in various fields to the computer environment, to reuse information which is handwritten or printed documents via computers. However, in order to reuse and store the documents or files containing this information, the information must be read and questioned. For these reasons, there is a need for automatic retrieval and storage of information from image files, especially text. Optical Character Recognition (OCR) is an active research area that has been attracting researchers in recent years, trying to develop a computer system capable of automatically extracting and processing text from images. The purpose of OCR is to achieve changes or conversions in any text format or documents containing handwriting. Thus, printed or scanned text images can be edited and stored in digital format for deeper and further processing. In order for the characters in the image to be recognized correctly, various factors such as various defects on the image, the font properties of the characters, and the amount of light should be regulated. For this reason, it is necessary to apply various image processing techniques such as noise reduction, rotation correction, binarization and normalization on the images to be used. These procedures are a solution to the difficulties that may be encountered in the next stages and have a very important place in terms of making accurate recognition. In this study, it is aimed to increase the recognition speed and recognition with less data as a result of using the information obtained from the Circle Fill Rate method, which is a method based on skeletal representation, and CNN (Convolutional Neural Network) which is one of the deep learning techniques, together with less data.The images used in the study are made ready to be used for training in the CNN model created by applying the necessary image processing techniques in Matlab platform. In the first stage, character images were used as inputs in the CNN model. Later, the images created with skeletal representations were used visually by applying PCA (Principle Components Analysis) to the points obtained with the skeleton points and the Circle Filling Rate method, and new images were obtained with this process. These images were used in the same CNN model and trained. Performance comparisons were made between the accuracy rates of the test results obtained as a result of the trainings conducted and the results were presented with experimental studies.

Benzer Tezler

  1. A Bayesian longitudinal circular model and model selection

    Bayesci uzunlamasına dairesel bir model ve model seçimi

    ONUR ÇAMLI

    Yüksek Lisans

    İngilizce

    İngilizce

    2017

    İstatistikOrta Doğu Teknik Üniversitesi

    İstatistik Ana Bilim Dalı

    DOÇ. DR. ZEYNEP IŞIL KALAYLIOĞLU AKYILDIZ

  2. Aeroelastic modeling and analysis of high aspect ratio wings with different fidelity structural models

    Yüksek en-boy oranına sahip kanatlar için farklı doğruluktaki yapısal modellerle aeroelastik analiz ve modelleme

    GÖKÇEN ÇİÇEK

    Yüksek Lisans

    İngilizce

    İngilizce

    2019

    Havacılık MühendisliğiOrta Doğu Teknik Üniversitesi

    Havacılık ve Uzay Mühendisliği Ana Bilim Dalı

    PROF. DR. ALTAN KAYRAN

  3. Unsteady aerodynamic calculations of flappping wing motion

    Çırpan kanat hareketinin zamana bağlı aerodinamik hesaplamaları

    BÜŞRA AKAY

    Yüksek Lisans

    İngilizce

    İngilizce

    2007

    Havacılık MühendisliğiOrta Doğu Teknik Üniversitesi

    Havacılık ve Uzay Mühendisliği Ana Bilim Dalı

    PROF. DR. NAFİZ ALEMDAROĞLU

  4. The Arnold invariants of immersed plane curves

    Düzlemdeki çember batırmalarının Arnold değişmezleri

    NERMİN SALEPCİ

    Yüksek Lisans

    İngilizce

    İngilizce

    2001

    MatematikOrta Doğu Teknik Üniversitesi

    Matematik Ana Bilim Dalı

    PROF. DR. SERGEY FİNASHİN

  5. On the Hamiltonian circle actions and symplectic reduction

    Hamilton çember etkileri ve simpletik bölüm uzayları

    ALİ SAİT DEMİR

    Yüksek Lisans

    İngilizce

    İngilizce

    2003

    MatematikOrta Doğu Teknik Üniversitesi

    Matematik Ana Bilim Dalı

    DOÇ.DR. YILDIRAY OZAN