Integrated segmentation and recognition of handwritten digits
Elyazı rakamların birleştirilmiş tanıma ve bölütlendirilmesi
- Tez No: 47448
- Danışmanlar: Y.DOÇ.DR. ETHEM ALPAYDIN
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 1995
- Dil: İngilizce
- Üniversite: Boğaziçi Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Belirtilmemiş.
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 58
Özet
KISA ÖZET Bu çalışma elyazısı rakamların tanınmasında kullanılan yeni bir yaklaşımı içerir. Elyazısı rakamlarını tanıma sistemi (EYRTS) hemen tüm diğer klasik damga tanıma sistemleri gibi iki tane birbirini takip eden ana parçadan oluşur: Bölütleme ve Tanıma. Her iki parçada, yapay sinir ağı (YSA) sınırlayıcılarını kullanır ve bu sınırlayıcılar YSA bölütleyici ve YSA tanıyıcı olarak adlandırılırlar. Bölütleme parçasında, imge işleme (gürültü azaltma, kayma düzeltme vs.) ve öznitelik çıkarım teknikleri kullanılmadı. Bu parçada giriş olarak 300 dpi sayısallaştınlmış imgeler kullandı. İlk iş, imge içinde rakam dizilerini (alan) bulmak ve bunları belli bir büyüklüğe getirmektir. Bu çalışmadaki yenilik rakamların bölütlendirilmesinin bir YSA tarafından yapılmasıdır. Genellikle bölütlendirme sezgisel yöntemlerle yapıldığı için, bu yöntemler damgaların değmesi durumunda doğru bölütlendirme yapamazlar. YSA bölütleyici değen veya kırılmış damgaları doğru olarak bölütleyebilir. YSA bölütleyici her bir alanın üzerinde bir pencere dolaştırarak o alanın içindeki rakam sınırlarını bulur. YSA bölütleyici burada her bir pencere için 0 veya 1 üretir. Bu çıktı pencerenin merkezinde rakam sınırı olup olmadığını gösterir. Sonra alanın içindeki tüm rakamlar YSA bölütleyicisinin o alan için ürettiği tüm çıktılar kullanılarak bölütlenir. YSA bölütleyici tarafından bölütlenmiş rakamlar tanıma parçasının girişlerini oluşturur. Bu rakamlar YSA tanıyıcısının kullanabileceği büyüklüğe getirilirler ve YSA tanıyıcı bunları 0 ile 9 arasındaki bir rakam olarak sınıflar. YSA bölütleyici öznitelik çıkarımı ve sınıflamayı reddetme mekanizması kullanmaz. EYRTS 18 kişiden alınmış 15,895 damga içeren bir veri tabanı ile eğitildi. Deneme için kullanılan veri tabanında ise 10 kişiden alınmış 3,000 damga vardır. Sonuç olarak bölütlendirmede %97.80, tanımada yazıcı bağımlı durumda %93.66, yazıcı bağımsız durumda ise %85.65 başarı elde edildi.
Özet (Çeviri)
IV ABSTRACT This study outlines a new approach to handwritten digit recognition. The handwritten digit recognition system (the HWDRS) consists of two successive phases like other classical OCRs: Segmentation and Recognition. The HWDRS uses neural network (NN) classifiers in both phases: the NN Segmenter and the NN Recogniser. In the segmentation phase, no particular image processing (noise elimination, skew correction, etc.) and feature extraction techniques have been carried out. Digitised handwritten digit images are input to the segmentation phase. The fields (digit strings) are extracted and normalised. The novelty of this work is that the segmentation of digits are done by a neural network that is trained for this task. Normally this is done based on heuristics and they frequently fail when characters are touching. The NN Segmenter can learn to segment touching or broken characters. All digit boundaries are found using the NN Segmenter by sliding a window on each field. The NN Segmenter produces a binary output which can be interpreted as“there is”or“there is not”a digit boundary at the window centre. Then all digits in each field are segmented by the help of these binary values. The digits segmented by the NN Segmenter are input to the recognition phase. The digits are normalised to a fixed dimension which can be accepted by the NN Recogniser. The NN Recogniser classifies each input pattern as one of the numerals. It does not use feature extraction and rejection mechanisms for the classification purposes. The HWDRS trained with the database of 15,895 digits from 18 writers. The test database contains 3,000 characters from 10 writers. Results are 97.80% for segmentation and 93.66% for recognition in the writer dependent case and 85.65% for recognition in the writer independent case.
Benzer Tezler
- Integrated segmentation and recognition of connected Ottoman script
Bitişik Osmanlıca yazı için tümleşik bölütleme ve tanıma
İSMET ZEKİ YALNIZ
Yüksek Lisans
İngilizce
2008
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİhsan Doğramacı Bilkent ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. ÖZGÜR ULUSOY
DOÇ. DR. UĞUR GÜDÜKBAY
- Lifelong learning for auditory scene analysis
İşitsel sahne analizi için hayat boyu öğrenme
BARIŞ BAYRAM
Doktora
İngilizce
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. GÖKHAN İNCE
- Development of a face recognition system
Bir yüz tanıma sisteminin geliştirilmesi
CAHİT GÜREL
Yüksek Lisans
İngilizce
2011
Makine MühendisliğiAtılım ÜniversitesiMekatronik Mühendisliği Ana Bilim Dalı
PROF. DR. ABDULKADİR ERDEN
- Gabor filtreleri ve seyrek gösterim ile SAR görüntülerinde otomatik hedef tanıma
Automatic target recognition in SAR images by using sparse representation and Gabor filters
AHMET KARAGÖZ
Yüksek Lisans
Türkçe
2018
Elektrik ve Elektronik MühendisliğiGazi ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
PROF. DR. İRFAN KARAGÖZ
- Automatic speech recognition in consecutive interpreter workstation: Computer-aided interpreting tool 'Sight-Terp'
Otomatik konuşma tanıma sistemlerinin ardıl çeviride kullanılması: Sight-Terp
CİHAN ÜNLÜ
Yüksek Lisans
İngilizce
2023
Mütercim-TercümanlıkHacettepe ÜniversitesiMütercim Tercümanlık Ana Bilim Dalı
PROF. DR. AYMİL DOĞAN