Geri Dön

Doküman kategorizasyonu ve imza bölge analizi

Document categorization and signature region analysis

  1. Tez No: 364258
  2. Yazar: İLKHAN CÜCELOĞLU
  3. Danışmanlar: DOÇ. DR. HASAN OĞUL
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bankacılık, Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Sigortacılık, Banking, Computer Engineering and Computer Science and Control, Insurance
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2014
  8. Dil: Türkçe
  9. Üniversite: Başkent Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 73

Özet

Bu tezde, taranmış doküman görüntülerinin otomatik analizi üzerine çalışmalar yapılmıştır. Bu amaçla doküman analizinde iki alt problem ele alınmıştır; dokümanların otomatik kategorizasyonu ve doküman üzerinde imza tespiti. Doküman tabanlı resimlerin kategorizasyonu birçok uygulama için önemli bir araçtır. Bu çalışma bankacılık uygulamalarında sık kullanılan dokümanları kategorize eden bir altyapıyı tanıtmaktadır. Altyapı, dokümandan oluşturulan metin bilgisi ve doküman resim özniteliklerini kullanmaktadır. Özniteliklerin çıkartılması ve seçilmesi ile ilgili teknik uygulanmış ve Türkçe metinler için özelleştirilmiştir. Dokümanın resim özniteliklerini kullanarak yapılan kategorizasyon ise, işlem maliyeti yüksek olan optik karakter tanıma işlemine gereksinim duymadığından daha hızlı sonuç veren bir alternatif sunmaktadır. Dokümanlarda elle atılan imzanın bulunduğu bölgenin otomatik olarak belirlenmesi bankacılık, sigorta ve kamu sektöründeki iş süreçlerinde katma değer üretebilecek bir özelliktir. Çalışma, herhangi bir tip sigorta dokümanından imzanın çıkarılmasını sağlayan bir altyapıyı tanıtmaktadır. Geliştirilen altyapı, bölütlere ayrılmış resmin temsil eden resim öznitelikleri ile sınıflandırılması işlemine dayanmaktadır. Bölütleme, iki etaplı bağlı bileşenlerinin etiketlenmesi ile gerçekleştirilmektedir. Bölütler, farklı öznitelik temsil yöntemleri ile vektöre çevrilip, destek vektör makineleri ile sınıflandırılarak imza içeren ve içermeyen olarak ayrıştırılmaktadır. Gerçek sigorta dokümanlarından oluşan veri kümesi üzerinde yapılan deneyler, geliştirilen altyapının yüksek doğruluk değerlerine ulaşabildiğini ve gerçek hayattaki uygulamalarla birlikte çalışabileceğini göstermektedir.

Özet (Çeviri)

This thesis contains studies related to automated analysis of document images. Two sub-problems in document analysis are considered for his purpose; automated categorization of documents and handwritten signature detection on documents. Classifying document images is an essential tool for many applications. This work presents a framework for categorizing documents which are frequently used in bank applications. The framework is based on the extracted text information and document image features. A feature extraction and selection technique is applied customized for Turkish texts. Categorization based on document image features is an alternative giving results in a faster way, because it works without the optical character recognition process, which is a computational intensive task. Automated localization of a handwritten signature in a scanned document is a promising facility for many banking and insurance related business activities. This work also describes here a discriminative framework to extract signature from a insurance service application document of any type. The framework is based on the classification of segmented image regions using a set of representative features. The segmentation is done using a two-phase connected component labeling approach. The combined effects of several feature representation schemes in distinguishing signature and non-signature segments is evaluated over a Support Vector Machine classifier. The experiments on a real insurance data set have shown that the developed framework can achieve a reasonably good accuracy to be used in real life applications.

Benzer Tezler

  1. Metin madenciliği ile metin sınıflandırma

    Text categorization with text mining

    İSMAİL FERHAT PİLAVCILAR

    Yüksek Lisans

    Türkçe

    Türkçe

    2007

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolYıldız Teknik Üniversitesi

    Matematik Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. NİLGÜN GÜLER BAYAZIT

  2. Evaluation of taxonomy based concept extraction system cosmix case for text categorization

    Taksonomi bazlı konsept çıkarım sistemi kosmix'in text kategorizasyonu alanında değerlendirilmesi

    UMUT ERGÜN

    Yüksek Lisans

    İngilizce

    İngilizce

    2011

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolÇankaya Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. ABDÜL KADİR GÖRÜR

  3. Urdu news categorization using machine learning approaches

    Makine öğrenmesi yaklaşımları kullanarak urduca haberlerin kategorizasyonu

    MUHAMMAD TALHA SATTI

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBEYKOZ ÜNİVERSİTESİ

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. ÖZLEM FEYZA ERKAN

  4. Hastane yataklarında konfor kavramının incelenmesi

    Examination of hospital beds in terms of comfort

    GÜZİDE GÜZELBEY

    Yüksek Lisans

    Türkçe

    Türkçe

    2016

    Endüstri Ürünleri Tasarımıİstanbul Teknik Üniversitesi

    Endüstri Ürünleri Tasarımı Ana Bilim Dalı

    YRD. DOÇ. DR. EKREM CEM ALPPAY

  5. Improving diversity of search results for the National Library of Turkey

    Millî Kütüphane arama sonuçlarında konu çeşitlendirme iyileştirmesi

    CEYDA OKUYAN

    Yüksek Lisans

    İngilizce

    İngilizce

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolTED Üniversitesi

    İnteraktif Bilişim Sistemleri Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ TAYFUN KÜÇÜKYILMAZ