Contextual post processing for Turkish optical character recognition
Türkçe optik karakter tanıma için bağlamsal son işleme
- Tez No: 119244
- Danışmanlar: DOÇ. DR. VOLKAN ATALAY
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Optik Karakter Tanıma, Sözlük İçinde Arama, Bağlamsal Son İşleme, N-gram İstatistikleri, Hata Düzeltici Ayrıştırıcı, Türkçe Morfoloji, Optical Character Recognition, Lexicon Search, Contextual Post Processing, N-gram Statistics, Error Correcting Parser, Turkish Morphology. in > C. YÜKSEK
- Yıl: 2002
- Dil: İngilizce
- Üniversite: Orta Doğu Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 86
Özet
oz TÜRKÇE OPTİK KARAKTER TANIMA İÇİN BAGLAMSAL SON İŞLEME Korkmaz, Sait Ulaş Yüksek Lisans Tezi, Bilgisayar Mühendisliği Bölümü Tez Yöneticisi: Assoc. Prof. Dr. Volkan Atalay Eylül 2002, 74 sayfa Bu çalışmada Türkçe basılı harfler için geliştirilen bir optik karakter tanıma sistemi için bağlamsal son işleme alt sistemi sunulmuştur. Bağlamsal son işleme alt sistemi Türkçe pozisyona bağlı ikili 3 -gram istatistikleri, bir hata düzeltici ayrıştırıcı ve Türkçe'deki kök kelimeleri ve bunların çekimli hallerini içeren bir sözlük üzerine kurulmuştur. N-gram istatistikleri optik karakter tanıyıcının tanıdığı aday kelimeler için oluşturulan benzerlik kümelerindeki elemanları elemekte kullanılır. Sözlük ise aday kelimelere 2 veya daha az karakter düzenleme uzaklıktaki kelimeleri aramak için kullanılır. Hata düzeltici ayrıştırıcı ise Türkçe biçim bilimini kullanarak optik karakter tanıyıcının adayları arasında kökünü doğru tanıdığı kelimeleri düzeltmek için kullanılır. iv
Özet (Çeviri)
ABSTRACT CONTEXTUAL POST PROCESSING FOR TURKISH CHARACTER RECOGNITION Korkmaz, Sait Ulaş M.Sc, Department of Computer Engineering Supervisor: Assoc. Prof. Dr. Volkan Atalay September 2002, 74 pages This thesis presents a contextual post processing subsystem for a Turkish machine printed optical character recognition system. The contextual post processing subsystem is based on positional binary 3 -gram statistics for Turkish language, an error corrector parser and a lexicon, which contains root words and the inflected forms of the root words. Positional binary 3-gram statistics is used to eliminate the elements of the similarity sets built for optical character recognition (OCR) results. The lexicon is used for searching for alternatives that have 2 or less edit string distance to OCR candidates. Error corrector parser is used for correcting OCR alternatives using Turkish Morphology.
Benzer Tezler
- Digital video stabilization with SIFT flow
SIFT akışı ile sayısal video sabitleme
İNCİ MELİHA BAYTAŞ
Yüksek Lisans
İngilizce
2014
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
PROF. DR. MELİH PAZARCI
- Rescoring detections based on contextual scores in object detection
Nesne algılama yöntemlerinden elde edilen sezimlerin skorlarının bağlam bilgisi kullanılarak yeniden hesaplanması
ERSAN VURAL ZORLU
Yüksek Lisans
İngilizce
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ EMRE AKBAŞ
- Change detection of buildings from high resolution satellite imagery and existing map data using object based classification
Nesne tabanlı sınıflandırma ile yüksek çözünürlüklü uydu görüntüleri ve mevcut harita verilerinden bina değişimlerinin tespiti
FATEMEH SAFARLOU
Yüksek Lisans
İngilizce
2015
Jeodezi ve FotogrametriHacettepe ÜniversitesiGeomatik Mühendisliği Ana Bilim Dalı
PROF. DR. MUSTAFA TÜRKER
- Enhancing scene sketch understanding through a dual-network: Visio-temporal segmentation and context-aware sketch recognition
Çift ağ ile sahne çizimi anlamayı geliştirme: Görsel-zamansal bölütleme ve bağlam farkındalıklı çizim tanıma
ALEYNA KÜTÜK
Yüksek Lisans
İngilizce
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKoç ÜniversitesiBilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı
PROF. DR. TEVFİK METİN SEZGİN
- Kişiye özel tercüme modelleme (KÖTM)
Personalized interpreting modeling (PİM)
REFİKA ZUHAL VURAL
Doktora
Türkçe
2023
Mütercim-TercümanlıkSakarya ÜniversitesiMütercim Tercümanlık Ana Bilim Dalı
DOÇ. DR. MUHAMMED ZAHİT CAN