Geri Dön

Low level image processing tools for optical character recognition of Turkish newspapers

Türkçe gazetelerde optik damga tanıma için düşük düzeyli imge işleme araçları

  1. Tez No: 82861
  2. Yazar: UFUK BARIŞ
  3. Danışmanlar: PROF. DR. MEHMET BÜLENT SANKUR
  4. Tez Türü: Yüksek Lisans
  5. Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 1999
  8. Dil: İngilizce
  9. Üniversite: Boğaziçi Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 182

Özet

ÖZET Bu tezde yer alan yöntemlerin amacı yazı imge bloğunu ASCII metin haline çevirmektir. İlk önce öncül satır belirleme ve nihai satır ayırma adımlarını içeren geliştirilmiş bir satır bölütleme yöntemi uygulanmıştır. Daha sonra her damganın yeri saptanmış ve bir silme çerçeve içerisine yerleştirilmiştir. Damga bölütlendirme adımım damga önsınıflandırma yöntemi takip etmiş ve damgalar 8 önsınıfa ayrılmıştır. Bu önsımflardan bir tanesi Türkçe noktalı küçük harfleri (i, ö, ü) içerir. Karşılaştırmalı olarak değerlendirilen çift doğrusal ve en yakın komşuluk aradeğerleme yöntemlerinden çift doğrusal aradağerleme yöntemi boyut düzgelemesi için kullanılmıştır. Bir damga tanıma yöntemini geribesleme olarak kullanan bitişik damga bölütlendirme yöntemi bitişik damgaların ayrılmasında kullanılmıştır. Birçok öznitelik arasında, şablonlar, pencere gözleri ve Fourier belirteçleri birbirlerini tamamlama özelliklerine sahip oldukları için öznitelik olarak kullanılmıştır. Damga sınıflandırma için, RBF yapay sinir ağı ve şablon eşleme yöntemleri seçilmiştir. RBF yapay sinir ağı, pencere gözü ve Fourier belirteçleri ile beslenmiştir. Daha sonra basit dilbilimsel kuralları içeren ardişleme yöntemi kullanılmıştır. En son olarak geliştirilen birleştirme adımı yardımı ile sınırlandırıcı çıkışları birleştirilmiş ve nihayi metin elde edilmiştir. Sonuç olarak, % 99.2 doğru tanıma başanmına sahip damga tanıma yazılımı geliştirilmiştir.

Özet (Çeviri)

IV ABSTRACT The objective of the methods which are included by this thesis is to convert a text image block to ASCII text. Firstly we have implemented a modified line segmentation method that comprises an initial line identification step and a final line segmentation step. Each character was then located, segmented and put into its bounding box. The character segmentation step was followed by a preclassification step in which characters were separated into 8 preclasses (one of them is for Turkish lower case letters with dots (i,ü,ö)). We have comparatively assessed bilinear and nearest neighbour interpolation methods and bilinear was used for size normalization. A merged character segmentation method employing feedback from a character recognition tool was used. Among several possible feature types, we have used templates, zoning and Fourier descriptors. The rationale for their choice was that they were somewhat complementary to each other. For character classification, the RBF neural network and template matching were chosen. The RBF classifier was applied to zoning and Fourier descriptors feature sets. A post processing step that includes some basic linguistic rules was employed. The outputs were combined to get the ultimate OCR text output. In conclusion, we have developed a complete OCR software that archives 99.2 % correct recognition performance.

Benzer Tezler

  1. Bankacılık sektöründe robotik süreç otomasyonu - bir uygulama örneği

    Robotic process automation in the banking industry - an application example

    ÖMER BAŞTÜRK

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    Endüstri ve Endüstri MühendisliğiSakarya Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ SEHER ARSLANKAYA

  2. Medical image compression based on vector quantization and discrete wavelet transform

    Vektör kuantizasyonu ve ayrık dalgacık dönüşümüne dayalı tıbbi görüntü sıkıştırma

    AZHAR ABDULHASAN MUHAMMED ALI AJAM

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSakarya Üniversitesi

    Bilgisayar ve Bilişim Mühendisliği Ana Bilim Dalı

    PROF. DR. AHMET ZENGİN

  3. Holografik mikroskopinin hücresel analiz ve veri güvenliği performansının iyileştirilmesi

    Improvement of cellular analysis and data security performance of holographic microscopy

    MUHAMMED ALİ PALA

    Doktora

    Türkçe

    Türkçe

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSakarya Uygulamalı Bilimler Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    DOÇ. DR. MUSTAFA ZAHİD YILDIZ

  4. Distortion detection and restoration pipeline for phase contrast microscopy time-series-images

    Faz kontrast microskopi zaman serisi goruntulerinde bozulma tespiti ve yeniden yapılandırma algoritması

    MAHMUT UÇAR

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Elektrik ve Elektronik Mühendisliğiİzmir Demokrasi Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    PROF. DR. DEVRİM ÜNAY

    PROF. DR. Uğur TÖREYİN

  5. Elektro-optik ve SAR uydu görüntüleri ile arazi bitki örtüsünün belirlenmesi

    Defining land vegetation type using electro-optic and SAR satellite images

    FÜSUN BALIK

    Doktora

    Türkçe

    Türkçe

    2004

    Jeodezi ve FotogrametriYıldız Teknik Üniversitesi

    Jeodezi ve Fotogrametri Mühendisliği Ana Bilim Dalı

    PROF.DR. AYHAN ALKIŞ