Design of an offline ottoman character recognition system for translating printed documents to modern turkish
Basılı dökümanların modern türkçeye çevrilmesi için çevrimdışı osmanlıca karakter tanıma sistemi tasarımı
- Tez No: 617354
- Danışmanlar: DR. ÖĞR. ÜYESİ MEHMET ZÜBEYİR ÜNLÜ
- Tez Türü: Yüksek Lisans
- Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2019
- Dil: İngilizce
- Üniversite: İzmir Yüksek Teknoloji Enstitüsü
- Enstitü: Mühendislik ve Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 86
Özet
Optik karakter tanıma yıllardır üzerinde en çok çalışma yapılan konulardan bir tanesidir. Bu çalışmaların sonucunda, özellikle Latin alfabesi için geliştirilen sistemler el yazısı metinler için bile iyi tanıma sonuçları gösterir hale gelmişlerdir. Ancak literatürdeki Osmanlıca optik karakter tanıma sistemleri için yapılan çalışmalar oldukça sınırlıdır. Gramer, yazma ve heceleme gibi konulardaki karmaşıklığından dolayı Osmanlıca, optik karakter tanıma alanında ilgi çekiciliğini hala korumaktadır. Bu çalışmada, derin evrişimsel sinir ağları kullanılarak Osmanlıca için çevrimdışı karakter tanıma sistemi tasarlanması amaçlanmıştır. Yapılan çalışma, görüntü işleme, taratılan metinlerin sayısallaştırılarak karakter parçalarına ayrılması, Osmanlıca karakter veri setinin oluşturularak sinir ağına uyarlanması, sinir ağının eğitilmesi, karakterlerin tanınması ve karakter tanıma oranlarının değerlendirilmesi adımlarından oluşmaktadır. Bu amaçla ilk olarak, Milli Kütüphane'nin sayısal veritabanından seçilmiş çeşitli Osmanlıca eserlerden alınan farklı uzunluktaki taranmış metin görüntüleri bölütlenerek karakter veri seti oluşturulmuştur. Farklı karmaşıklıktaki iki evrişimsel sinir ağı, oluşturulan karakter seti ile eğitilmiş ve tanıma oranları ile ağ karmaşıklığı ilişkisi değerlendirilmiştir. Daha sonra Yönelimli Gradyanların Histogramı ve Temel Bileşen Analizi kullanılarak oluşturulan veri setinin öznitelikleri çıkarılmış ve Osmanlıca karakterler bu öznitelikler kullanılarak literatürde yaygın olarak uygulanan sınıflandırma yöntemlerinden, k-En Yakın Komşu Algoritması ve Destek Vektör Makineleri ile sınıflandırılmıştır. Yapılan performans analizleri, her iki ağın da geleneksel sınıflandırıcılara kıyasla daha iyi tanıma oranlarına sahip olduğunu göstermiş, bununla beraber karmaşık derin evrişimsel sinir ağının en yüksek tanıma oranına sahip olduğunu ortaya koymuştur.
Özet (Çeviri)
Optical character recognition (OCR) is one of the most studied topics for many years. As a result of these studies, systems developed especially for the Latin alphabet have become more accurate even for handwritten texts. However, there are very limited studies on Ottoman OCR systems in the literature and it is still a subject of interest due to the complexity of the language in grammar, writing and spelling. In this thesis, it is aimed to design an offline OCR system that recognizes Ottoman characters using deep convolutional neural networks. The proposed work consists of several steps such as image processing, image digitization and character segmentation, adaptation of inputs to the network, training of the network, recognition and evaluation of results. Firstly, a character dataset was created by segmenting text images of different lengths that was selected among scanned samples of various Ottoman literature from the digital database of Turkish National Library. Two convolutional neural networks of different complexity were trained with the created character dataset and the relationship between recognition rates and network complexity was evaluated. Secondly, using the Histogram of Oriented Gradients and Principal Component Analysis, the features of the created dataset were extracted and the Ottoman characters were classified with k-Nearest Neighbor Algorithm and Support Vector Machines which are widely used classification methods in the literature. The performed analyzes have shown that both networks provide acceptable recognition rates compared to the conventional classifiers, however complex deep neural network showed better accuracy and lower loss.
Benzer Tezler
- New dating and marriage practices of Muslim women: Marriage websites in Turkey
Müslüman kadınların yeni tanışma ve evlenme biçimleri: Türkiye'de evlilik siteleri
AYLİN SUNAM
Doktora
İngilizce
2017
SosyolojiGalatasaray ÜniversitesiRadyo Televizyon ve Sinema Ana Bilim Dalı
PROF. DR. HÜLYA UĞUR TANRIÖVER
- Destek vektör regresyonu ile PID kontrolör tasarımı
Design of PID controller via support vector regression
KEMAL UÇAK
Yüksek Lisans
Türkçe
2012
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiKontrol ve Otomasyon Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. GÜLAY ÖKE
- NARMA-L2 controller design for nonlinear systems using online lssvr
Doğrusal olmayan sistemler için çevrimiçi en küçük kareler destek vektör regresyonu ile NARMA-L2 kontrolör tasarımı
GÖKÇEN DEVLET ŞEN
Yüksek Lisans
İngilizce
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiKontrol ve Otomasyon Mühendisliği Ana Bilim Dalı
DOÇ. DR. GÜLAY ÖKE GÜNEL
- Radyal taban fonksiyonlu yapay sinir ağı kullanarak zeki bir imza tanıma sistemi tasarımı
Design of an intelligent signature recognition system by using radial basis function neural network
ARMAĞAN EBRU TEMİZ
Yüksek Lisans
Türkçe
2015
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSakarya ÜniversitesiElektronik-Bilgisayar Eğitimi Ana Bilim Dalı
PROF. DR. RAŞİT KÖKER
- Design of an intelligent boost pressure controller for a series sequential turbocharged diesel engine
Seri bağlı aşırı doldurma sistemine sahip dizel motorlar için akıllı manifold basıncı kontrolcüsü tasarımı
MUSTAFA ENGİN EMEKLİ
Doktora
İngilizce
2015
Makine Mühendisliğiİstanbul Teknik ÜniversitesiMakine Mühendisliği Ana Bilim Dalı
PROF. DR. BİLİN AKSUN GÜVENÇ