Yazılı Türkçe metinlerde otomatik karakter tanıma
Automatic character recognation on Turkish text images
- Tez No: 55389
- Danışmanlar: DOÇ.DR. EMİN AKATA
- Tez Türü: Yüksek Lisans
- Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 1996
- Dil: Türkçe
- Üniversite: Hacettepe Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Belirtilmemiş.
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 100
Özet
IV ÖZET Bu tezde genel amaçlı bir karakter tanıma yazılımı, belirli fontlar altında verilen karakter kümelerinden otomatik özellik bulma ve bu özellikleri öğrenerek tanıma yöntemine dayalı olarak geliştirilmiştir. Söz konusu yazılım, özel olarak Türkçe yazılı metinler için karakter tanıma yazılımı olarak test edilmiş ve yeni özelliklerin de ilavesi ile daha da duyarlı hale getirilmiştir. Programlar DOS ortamında, Pascal dilinde gerçekleştirilmiştir. Örüntüdeki karakterlerin ayrıştırılıp tanınması ve sonucun ASCII karakter düzeninde kullanıcıya aktarılması olarak ifade edilen otomatik karakter tanıma işlemi gerçekleştirilirken, bugüne dek kullanılmayan kimi özgün özellikler araştırılarak, bu tür çalışmalarda kullanılabilecek yeni bir özellikler kümesi oluşturulmuştur. Öğrenme aşamasında üretilen özellik bilgileri sayesinde, öğretilen karakter setlerinden genel bir karar matrisi yazılım tarafindan otomatik biçimde oluşturulmaktadır. Tanıma aşamasında ise, yazılımın kullanılan yazı tipinden ve boyundan bağımsız olarak karakteri tanımasını sağlayacak metodlar geliştirilmiştir. Parametrik özelliklerin kullanılması sayesinde öğrenme aşamasının sonuçlan hem az yer kaplamış, hem de kullanılan diğer metodlara göre daha hızlı bir şekilde üretilebilmiştir. Bu sayede istenilen sayıda karakter setinin ek bir yer harcamadan aynı sisteme eklenmesi mümkün olmaktadır. Yapılan çalışmada, tarayıcı çıktılarının içerebileceği olası gürültü ve bozulmaların giderilebilmesi için gerekebilecek ön görüntü işleme uygulamaları kapsam dışı bırakılmıştır. ANAHTAR KELİMELER Optik Karakter Tanıma, Örüntü Tanıma, Türkçe Karakter Tanıma
Özet (Çeviri)
ABSTRACT In this thesis, a general purpose character recognition software based on automatic feature extraction is developed. The software, written in Pascal language on DOS platform is especially tested on Turkish texts written in selected fonts. Character recognition is a process for recognising the character by segmenting the image, extracting the features and giving the results to users in ASCII form. In this thesis a new feature set which is not implemented by other researchers is used. In the training stage, features are extracted and the general decision matrix is automatically formed from the trained character set by software. In the recognition stage, new methods are developed for recognising a character independent of its font and size. By using parametric features, the results of the training stage occupy smaller disk space and are produced faster than other methods. Thus, any new character set could be added to the system without limits. The image processing application for filtering noise and distortion after the scanning process is not implemented in this study. KEYWORDS: Optical Character Recognition (OCR), Image Recognition, Turkish Character Recognition
Benzer Tezler
- İngilizcede çember dolgu oranı yöntemi ile optik karakter tanıma
Optical character recognition with circle filling rate method for English
SAHRA TİLKİ
Yüksek Lisans
Türkçe
2020
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Sabahattin Zaim ÜniversitesiBilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı
DR. YAHYA ŞİRİN
- Klavye ile yazıcı arasında doğrudan bağlanabilir metin düzenleme birimi
Keyboard to printer direct interface and text editing unit
ŞAHİN DEMİR
Yüksek Lisans
Türkçe
1996
Elektrik ve Elektronik MühendisliğiHacettepe ÜniversitesiDOÇ.DR. M. EMİN AKATA
- Emotion analysis of Turkish texts by using machine learning methods
Makine öğrenimi teknikleriyle Türkçe metinlerde duygu analizi
ZEYNEP BOYNUKALIN
Yüksek Lisans
İngilizce
2012
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. PINAR ŞENKUL
- Türkçe metinlerde duygu analizi yapılarak saldırgan içeriklerin tespit edilmesi
Detecting offensive content by performing senti̇ment analysis in turkish texts
ŞEYMA ŞAHİNER YILMAZ
Yüksek Lisans
Türkçe
2022
Bilim ve TeknolojiGazi ÜniversitesiYönetim Bilişim Sistemleri Ana Bilim Dalı
PROF. DR. HADİ GÖKÇEN
DR. ÖĞR. ÜYESİ İLYAS ÖZER
- Yazılı tıp metinleri çevirisi sürecinde ChatGPT3 sohbet robotunun konumu ve çeviri ürün kalitesinin değerlendirilmesi
The position of ChatGPT3 chatbot in the process of translation of written medical texts and evulation of translation product quality
RÜVEYDA CANBAZ
Yüksek Lisans
Türkçe
2024
Mütercim-TercümanlıkSakarya ÜniversitesiÇeviribilim Ana Bilim Dalı
DR. ÖĞR. ÜYESİ EYÜP ZENGİN