Geri Dön

Contextual post processing for Turkish optical character recognition

Türkçe optik karakter tanıma için bağlamsal son işleme

  1. Tez No: 119244
  2. Yazar: SAİT ULAŞ KORKMAZ
  3. Danışmanlar: DOÇ. DR. VOLKAN ATALAY
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Optik Karakter Tanıma, Sözlük İçinde Arama, Bağlamsal Son İşleme, N-gram İstatistikleri, Hata Düzeltici Ayrıştırıcı, Türkçe Morfoloji, Optical Character Recognition, Lexicon Search, Contextual Post Processing, N-gram Statistics, Error Correcting Parser, Turkish Morphology. in > C. YÜKSEK
  7. Yıl: 2002
  8. Dil: İngilizce
  9. Üniversite: Orta Doğu Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 86

Özet

oz TÜRKÇE OPTİK KARAKTER TANIMA İÇİN BAGLAMSAL SON İŞLEME Korkmaz, Sait Ulaş Yüksek Lisans Tezi, Bilgisayar Mühendisliği Bölümü Tez Yöneticisi: Assoc. Prof. Dr. Volkan Atalay Eylül 2002, 74 sayfa Bu çalışmada Türkçe basılı harfler için geliştirilen bir optik karakter tanıma sistemi için bağlamsal son işleme alt sistemi sunulmuştur. Bağlamsal son işleme alt sistemi Türkçe pozisyona bağlı ikili 3 -gram istatistikleri, bir hata düzeltici ayrıştırıcı ve Türkçe'deki kök kelimeleri ve bunların çekimli hallerini içeren bir sözlük üzerine kurulmuştur. N-gram istatistikleri optik karakter tanıyıcının tanıdığı aday kelimeler için oluşturulan benzerlik kümelerindeki elemanları elemekte kullanılır. Sözlük ise aday kelimelere 2 veya daha az karakter düzenleme uzaklıktaki kelimeleri aramak için kullanılır. Hata düzeltici ayrıştırıcı ise Türkçe biçim bilimini kullanarak optik karakter tanıyıcının adayları arasında kökünü doğru tanıdığı kelimeleri düzeltmek için kullanılır. iv

Özet (Çeviri)

ABSTRACT CONTEXTUAL POST PROCESSING FOR TURKISH CHARACTER RECOGNITION Korkmaz, Sait Ulaş M.Sc, Department of Computer Engineering Supervisor: Assoc. Prof. Dr. Volkan Atalay September 2002, 74 pages This thesis presents a contextual post processing subsystem for a Turkish machine printed optical character recognition system. The contextual post processing subsystem is based on positional binary 3 -gram statistics for Turkish language, an error corrector parser and a lexicon, which contains root words and the inflected forms of the root words. Positional binary 3-gram statistics is used to eliminate the elements of the similarity sets built for optical character recognition (OCR) results. The lexicon is used for searching for alternatives that have 2 or less edit string distance to OCR candidates. Error corrector parser is used for correcting OCR alternatives using Turkish Morphology.

Benzer Tezler

  1. Digital video stabilization with SIFT flow

    SIFT akışı ile sayısal video sabitleme

    İNCİ MELİHA BAYTAŞ

    Yüksek Lisans

    İngilizce

    İngilizce

    2014

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    PROF. DR. MELİH PAZARCI

  2. Rescoring detections based on contextual scores in object detection

    Nesne algılama yöntemlerinden elde edilen sezimlerin skorlarının bağlam bilgisi kullanılarak yeniden hesaplanması

    ERSAN VURAL ZORLU

    Yüksek Lisans

    İngilizce

    İngilizce

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ EMRE AKBAŞ

  3. Change detection of buildings from high resolution satellite imagery and existing map data using object based classification

    Nesne tabanlı sınıflandırma ile yüksek çözünürlüklü uydu görüntüleri ve mevcut harita verilerinden bina değişimlerinin tespiti

    FATEMEH SAFARLOU

    Yüksek Lisans

    İngilizce

    İngilizce

    2015

    Jeodezi ve FotogrametriHacettepe Üniversitesi

    Geomatik Mühendisliği Ana Bilim Dalı

    PROF. DR. MUSTAFA TÜRKER

  4. Enhancing scene sketch understanding through a dual-network: Visio-temporal segmentation and context-aware sketch recognition

    Çift ağ ile sahne çizimi anlamayı geliştirme: Görsel-zamansal bölütleme ve bağlam farkındalıklı çizim tanıma

    ALEYNA KÜTÜK

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKoç Üniversitesi

    Bilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı

    PROF. DR. TEVFİK METİN SEZGİN

  5. Kişiye özel tercüme modelleme (KÖTM)

    Personalized interpreting modeling (PİM)

    REFİKA ZUHAL VURAL

    Doktora

    Türkçe

    Türkçe

    2023

    Mütercim-TercümanlıkSakarya Üniversitesi

    Mütercim Tercümanlık Ana Bilim Dalı

    DOÇ. DR. MUHAMMED ZAHİT CAN