Geri Dön

Yazılı Türkçe metinlerde otomatik karakter tanıma

Automatic character recognation on Turkish text images

  1. Tez No: 55389
  2. Yazar: MUSTAFA AFYONLUOĞLU
  3. Danışmanlar: DOÇ.DR. EMİN AKATA
  4. Tez Türü: Yüksek Lisans
  5. Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 1996
  8. Dil: Türkçe
  9. Üniversite: Hacettepe Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Belirtilmemiş.
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 100

Özet

IV ÖZET Bu tezde genel amaçlı bir karakter tanıma yazılımı, belirli fontlar altında verilen karakter kümelerinden otomatik özellik bulma ve bu özellikleri öğrenerek tanıma yöntemine dayalı olarak geliştirilmiştir. Söz konusu yazılım, özel olarak Türkçe yazılı metinler için karakter tanıma yazılımı olarak test edilmiş ve yeni özelliklerin de ilavesi ile daha da duyarlı hale getirilmiştir. Programlar DOS ortamında, Pascal dilinde gerçekleştirilmiştir. Örüntüdeki karakterlerin ayrıştırılıp tanınması ve sonucun ASCII karakter düzeninde kullanıcıya aktarılması olarak ifade edilen otomatik karakter tanıma işlemi gerçekleştirilirken, bugüne dek kullanılmayan kimi özgün özellikler araştırılarak, bu tür çalışmalarda kullanılabilecek yeni bir özellikler kümesi oluşturulmuştur. Öğrenme aşamasında üretilen özellik bilgileri sayesinde, öğretilen karakter setlerinden genel bir karar matrisi yazılım tarafindan otomatik biçimde oluşturulmaktadır. Tanıma aşamasında ise, yazılımın kullanılan yazı tipinden ve boyundan bağımsız olarak karakteri tanımasını sağlayacak metodlar geliştirilmiştir. Parametrik özelliklerin kullanılması sayesinde öğrenme aşamasının sonuçlan hem az yer kaplamış, hem de kullanılan diğer metodlara göre daha hızlı bir şekilde üretilebilmiştir. Bu sayede istenilen sayıda karakter setinin ek bir yer harcamadan aynı sisteme eklenmesi mümkün olmaktadır. Yapılan çalışmada, tarayıcı çıktılarının içerebileceği olası gürültü ve bozulmaların giderilebilmesi için gerekebilecek ön görüntü işleme uygulamaları kapsam dışı bırakılmıştır. ANAHTAR KELİMELER Optik Karakter Tanıma, Örüntü Tanıma, Türkçe Karakter Tanıma

Özet (Çeviri)

ABSTRACT In this thesis, a general purpose character recognition software based on automatic feature extraction is developed. The software, written in Pascal language on DOS platform is especially tested on Turkish texts written in selected fonts. Character recognition is a process for recognising the character by segmenting the image, extracting the features and giving the results to users in ASCII form. In this thesis a new feature set which is not implemented by other researchers is used. In the training stage, features are extracted and the general decision matrix is automatically formed from the trained character set by software. In the recognition stage, new methods are developed for recognising a character independent of its font and size. By using parametric features, the results of the training stage occupy smaller disk space and are produced faster than other methods. Thus, any new character set could be added to the system without limits. The image processing application for filtering noise and distortion after the scanning process is not implemented in this study. KEYWORDS: Optical Character Recognition (OCR), Image Recognition, Turkish Character Recognition

Benzer Tezler

  1. İngilizcede çember dolgu oranı yöntemi ile optik karakter tanıma

    Optical character recognition with circle filling rate method for English

    SAHRA TİLKİ

    Yüksek Lisans

    Türkçe

    Türkçe

    2020

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Sabahattin Zaim Üniversitesi

    Bilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı

    DR. YAHYA ŞİRİN

  2. Klavye ile yazıcı arasında doğrudan bağlanabilir metin düzenleme birimi

    Keyboard to printer direct interface and text editing unit

    ŞAHİN DEMİR

    Yüksek Lisans

    Türkçe

    Türkçe

    1996

    Elektrik ve Elektronik MühendisliğiHacettepe Üniversitesi

    DOÇ.DR. M. EMİN AKATA

  3. Emotion analysis of Turkish texts by using machine learning methods

    Makine öğrenimi teknikleriyle Türkçe metinlerde duygu analizi

    ZEYNEP BOYNUKALIN

    Yüksek Lisans

    İngilizce

    İngilizce

    2012

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. PINAR ŞENKUL

  4. Türkçe metinlerde duygu analizi yapılarak saldırgan içeriklerin tespit edilmesi

    Detecting offensive content by performing senti̇ment analysis in turkish texts

    ŞEYMA ŞAHİNER YILMAZ

    Yüksek Lisans

    Türkçe

    Türkçe

    2022

    Bilim ve TeknolojiGazi Üniversitesi

    Yönetim Bilişim Sistemleri Ana Bilim Dalı

    PROF. DR. HADİ GÖKÇEN

    DR. ÖĞR. ÜYESİ İLYAS ÖZER

  5. Yazılı tıp metinleri çevirisi sürecinde ChatGPT3 sohbet robotunun konumu ve çeviri ürün kalitesinin değerlendirilmesi

    The position of ChatGPT3 chatbot in the process of translation of written medical texts and evulation of translation product quality

    RÜVEYDA CANBAZ

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    Mütercim-TercümanlıkSakarya Üniversitesi

    Çeviribilim Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ EYÜP ZENGİN