Low level image processing tools for optical character recognition of Turkish newspapers
Türkçe gazetelerde optik damga tanıma için düşük düzeyli imge işleme araçları
- Tez No: 82861
- Danışmanlar: PROF. DR. MEHMET BÜLENT SANKUR
- Tez Türü: Yüksek Lisans
- Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 1999
- Dil: İngilizce
- Üniversite: Boğaziçi Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 182
Özet
ÖZET Bu tezde yer alan yöntemlerin amacı yazı imge bloğunu ASCII metin haline çevirmektir. İlk önce öncül satır belirleme ve nihai satır ayırma adımlarını içeren geliştirilmiş bir satır bölütleme yöntemi uygulanmıştır. Daha sonra her damganın yeri saptanmış ve bir silme çerçeve içerisine yerleştirilmiştir. Damga bölütlendirme adımım damga önsınıflandırma yöntemi takip etmiş ve damgalar 8 önsınıfa ayrılmıştır. Bu önsımflardan bir tanesi Türkçe noktalı küçük harfleri (i, ö, ü) içerir. Karşılaştırmalı olarak değerlendirilen çift doğrusal ve en yakın komşuluk aradeğerleme yöntemlerinden çift doğrusal aradağerleme yöntemi boyut düzgelemesi için kullanılmıştır. Bir damga tanıma yöntemini geribesleme olarak kullanan bitişik damga bölütlendirme yöntemi bitişik damgaların ayrılmasında kullanılmıştır. Birçok öznitelik arasında, şablonlar, pencere gözleri ve Fourier belirteçleri birbirlerini tamamlama özelliklerine sahip oldukları için öznitelik olarak kullanılmıştır. Damga sınıflandırma için, RBF yapay sinir ağı ve şablon eşleme yöntemleri seçilmiştir. RBF yapay sinir ağı, pencere gözü ve Fourier belirteçleri ile beslenmiştir. Daha sonra basit dilbilimsel kuralları içeren ardişleme yöntemi kullanılmıştır. En son olarak geliştirilen birleştirme adımı yardımı ile sınırlandırıcı çıkışları birleştirilmiş ve nihayi metin elde edilmiştir. Sonuç olarak, % 99.2 doğru tanıma başanmına sahip damga tanıma yazılımı geliştirilmiştir.
Özet (Çeviri)
IV ABSTRACT The objective of the methods which are included by this thesis is to convert a text image block to ASCII text. Firstly we have implemented a modified line segmentation method that comprises an initial line identification step and a final line segmentation step. Each character was then located, segmented and put into its bounding box. The character segmentation step was followed by a preclassification step in which characters were separated into 8 preclasses (one of them is for Turkish lower case letters with dots (i,ü,ö)). We have comparatively assessed bilinear and nearest neighbour interpolation methods and bilinear was used for size normalization. A merged character segmentation method employing feedback from a character recognition tool was used. Among several possible feature types, we have used templates, zoning and Fourier descriptors. The rationale for their choice was that they were somewhat complementary to each other. For character classification, the RBF neural network and template matching were chosen. The RBF classifier was applied to zoning and Fourier descriptors feature sets. A post processing step that includes some basic linguistic rules was employed. The outputs were combined to get the ultimate OCR text output. In conclusion, we have developed a complete OCR software that archives 99.2 % correct recognition performance.
Benzer Tezler
- Bankacılık sektöründe robotik süreç otomasyonu - bir uygulama örneği
Robotic process automation in the banking industry - an application example
ÖMER BAŞTÜRK
Yüksek Lisans
Türkçe
2023
Endüstri ve Endüstri MühendisliğiSakarya ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ SEHER ARSLANKAYA
- Medical image compression based on vector quantization and discrete wavelet transform
Vektör kuantizasyonu ve ayrık dalgacık dönüşümüne dayalı tıbbi görüntü sıkıştırma
AZHAR ABDULHASAN MUHAMMED ALI AJAM
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSakarya ÜniversitesiBilgisayar ve Bilişim Mühendisliği Ana Bilim Dalı
PROF. DR. AHMET ZENGİN
- Holografik mikroskopinin hücresel analiz ve veri güvenliği performansının iyileştirilmesi
Improvement of cellular analysis and data security performance of holographic microscopy
MUHAMMED ALİ PALA
Doktora
Türkçe
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSakarya Uygulamalı Bilimler ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
DOÇ. DR. MUSTAFA ZAHİD YILDIZ
- Distortion detection and restoration pipeline for phase contrast microscopy time-series-images
Faz kontrast microskopi zaman serisi goruntulerinde bozulma tespiti ve yeniden yapılandırma algoritması
MAHMUT UÇAR
Yüksek Lisans
İngilizce
2023
Elektrik ve Elektronik Mühendisliğiİzmir Demokrasi ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
PROF. DR. DEVRİM ÜNAY
PROF. DR. Uğur TÖREYİN
- Elektro-optik ve SAR uydu görüntüleri ile arazi bitki örtüsünün belirlenmesi
Defining land vegetation type using electro-optic and SAR satellite images
FÜSUN BALIK
Doktora
Türkçe
2004
Jeodezi ve FotogrametriYıldız Teknik ÜniversitesiJeodezi ve Fotogrametri Mühendisliği Ana Bilim Dalı
PROF.DR. AYHAN ALKIŞ