Geri Dön

Derin öğrenme ile Türkçe font ve karakter tanıma

Turkish font and character recognition with deep learning

  1. Tez No: 588512
  2. Yazar: AYLİN ŞEVİK
  3. Danışmanlar: DOÇ. DR. PAKİZE ERDOĞMUŞ
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2019
  8. Dil: Türkçe
  9. Üniversite: Düzce Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 99

Özet

Bu tezin amacı sayısal görüntülerden Türkçe karakter ve fontların tanınmasıdır. Tanıma işleminin gerçekleştirilebilmesi için elde edilen sayısal görüntü ikili hale getirildikten sonra, Türkçe harflere karşılık gelen her bir kapalı bölge, birbirlerinden ayrılmış ve sınırlarından kesilerek elde edilen harf görüntüsü sırasıyla önceden eğitilmiş harf ve font ağlarına gönderilerek sonuçlar alınmıştır. Bu işlemlerin görselleştirilmesi adına bir arayüz tasarlanmış ve metin içeren görüntü yüklendiğinde sonuç olarak alınan metin ve font bilgileri arayüzde gösterilmiştir. Türkçe harflerde bulunan şapka ve noktalar nedeniyle karakter tanıma işlemi zordur. Metinlerde bulunan i, j, ğ, ü ve ö gibi Türkçe karakterler başlangıçta harfin gövdesi ve parçası ayrı olacak şekilde bulunmuş ve geliştirilen algoritma ile her biri için ayrı karar mekanizmaları oluşturularak birleştirilmiş ve ağa bütün haliyle gönderilmiştir. Ayrıca bu çalışma için 227*227*3 boyutlarında 38 farklı font ve tüm Türkçe harfleri içeren toplamda yaklaşık olarak 13.000 adet harf görüntüsünden oluşan bir veri seti hazırlanmıştır. Yapılan testler sonucunda toplamda %42 harf tanıma başarısına ve %62,6 font tanıma başarısına ulaşılmıştır.

Özet (Çeviri)

The aim of this thesis is to recognize Turkish characters and fonts from numerical images. After the numerical image obtained for the recognition process to be realized, each closed region corresponding to the Turkish letters was separated from each other. The letter image, obtained by cutting off the boundaries, was sent to the pre-trained letter and font networks respectively and the results were taken. An interface is designed to visualize these processes. Text and font information as a result when the image that containing the text is loaded is shown in the interface. Character recognition is difficult because of the accents and dots in Turkish letters. Turkish characters such as i, j, ğ, ü and ö were found in the texts at the beginning. The body and part of the letter were found to be separate. An algorithm was combined to create separate decision mechanisms for each. In addition, a data set consisting of approximately 13,000 letter images containing a total of 38 different fonts and images on the entire Turkish letters in 227 * 227 * 3 size for this study was prepared. As a result of the tests, 42% letter recognition success and 62,6% font recognition success were achieved.

Benzer Tezler

  1. İngilizcede çember dolgu oranı yöntemi ile optik karakter tanıma

    Optical character recognition with circle filling rate method for English

    SAHRA TİLKİ

    Yüksek Lisans

    Türkçe

    Türkçe

    2020

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Sabahattin Zaim Üniversitesi

    Bilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı

    DR. YAHYA ŞİRİN

  2. Developing a deep learning based offline optical character recognition model for printed Ottoman turkish

    Derin öğrenme tabanlı çevrimdışı Osmanlıca basılı karakter tanıma modeli geliştirilmesi

    AHMED NADHEER QASIM AL-KHAFFAF

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ÜMİT ATİLA

  3. Derin öğrenme ile Türkçe haber metinlerine başlık üretme

    Generating Turkish news headlines with deep learning

    ABDULKADİR KARACA

    Yüksek Lisans

    Türkçe

    Türkçe

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolTrakya Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ÖZLEM AYDIN

  4. Derin öğrenme ile Türkçe sözcük türü işaretleme

    Part of speech tagging with deep learning for Turkish

    ŞEVKET CAN ŞEVKET

    Yüksek Lisans

    Türkçe

    Türkçe

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolEge Üniversitesi

    Uluslararası Bilgisayar Ana Bilim Dalı

    PROF. DR. BAHAR KARAOĞLAN

  5. Retrieving turkish prior legal cases with deep learning

    Derin öğrenme ile türkçe emsal karar bulma

    CEYHUN EMRE ÖZTÜRK

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİhsan Doğramacı Bilkent Üniversitesi

    Elektrik ve Elektronik Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ AYKUT KOÇ