Doküman kategorizasyonu ve imza bölge analizi
Document categorization and signature region analysis
- Tez No: 364258
- Danışmanlar: DOÇ. DR. HASAN OĞUL
- Tez Türü: Yüksek Lisans
- Konular: Bankacılık, Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Sigortacılık, Banking, Computer Engineering and Computer Science and Control, Insurance
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2014
- Dil: Türkçe
- Üniversite: Başkent Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 73
Özet
Bu tezde, taranmış doküman görüntülerinin otomatik analizi üzerine çalışmalar yapılmıştır. Bu amaçla doküman analizinde iki alt problem ele alınmıştır; dokümanların otomatik kategorizasyonu ve doküman üzerinde imza tespiti. Doküman tabanlı resimlerin kategorizasyonu birçok uygulama için önemli bir araçtır. Bu çalışma bankacılık uygulamalarında sık kullanılan dokümanları kategorize eden bir altyapıyı tanıtmaktadır. Altyapı, dokümandan oluşturulan metin bilgisi ve doküman resim özniteliklerini kullanmaktadır. Özniteliklerin çıkartılması ve seçilmesi ile ilgili teknik uygulanmış ve Türkçe metinler için özelleştirilmiştir. Dokümanın resim özniteliklerini kullanarak yapılan kategorizasyon ise, işlem maliyeti yüksek olan optik karakter tanıma işlemine gereksinim duymadığından daha hızlı sonuç veren bir alternatif sunmaktadır. Dokümanlarda elle atılan imzanın bulunduğu bölgenin otomatik olarak belirlenmesi bankacılık, sigorta ve kamu sektöründeki iş süreçlerinde katma değer üretebilecek bir özelliktir. Çalışma, herhangi bir tip sigorta dokümanından imzanın çıkarılmasını sağlayan bir altyapıyı tanıtmaktadır. Geliştirilen altyapı, bölütlere ayrılmış resmin temsil eden resim öznitelikleri ile sınıflandırılması işlemine dayanmaktadır. Bölütleme, iki etaplı bağlı bileşenlerinin etiketlenmesi ile gerçekleştirilmektedir. Bölütler, farklı öznitelik temsil yöntemleri ile vektöre çevrilip, destek vektör makineleri ile sınıflandırılarak imza içeren ve içermeyen olarak ayrıştırılmaktadır. Gerçek sigorta dokümanlarından oluşan veri kümesi üzerinde yapılan deneyler, geliştirilen altyapının yüksek doğruluk değerlerine ulaşabildiğini ve gerçek hayattaki uygulamalarla birlikte çalışabileceğini göstermektedir.
Özet (Çeviri)
This thesis contains studies related to automated analysis of document images. Two sub-problems in document analysis are considered for his purpose; automated categorization of documents and handwritten signature detection on documents. Classifying document images is an essential tool for many applications. This work presents a framework for categorizing documents which are frequently used in bank applications. The framework is based on the extracted text information and document image features. A feature extraction and selection technique is applied customized for Turkish texts. Categorization based on document image features is an alternative giving results in a faster way, because it works without the optical character recognition process, which is a computational intensive task. Automated localization of a handwritten signature in a scanned document is a promising facility for many banking and insurance related business activities. This work also describes here a discriminative framework to extract signature from a insurance service application document of any type. The framework is based on the classification of segmented image regions using a set of representative features. The segmentation is done using a two-phase connected component labeling approach. The combined effects of several feature representation schemes in distinguishing signature and non-signature segments is evaluated over a Support Vector Machine classifier. The experiments on a real insurance data set have shown that the developed framework can achieve a reasonably good accuracy to be used in real life applications.
Benzer Tezler
- Metin madenciliği ile metin sınıflandırma
Text categorization with text mining
İSMAİL FERHAT PİLAVCILAR
Yüksek Lisans
Türkçe
2007
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolYıldız Teknik ÜniversitesiMatematik Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. NİLGÜN GÜLER BAYAZIT
- Evaluation of taxonomy based concept extraction system cosmix case for text categorization
Taksonomi bazlı konsept çıkarım sistemi kosmix'in text kategorizasyonu alanında değerlendirilmesi
UMUT ERGÜN
Yüksek Lisans
İngilizce
2011
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolÇankaya ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. ABDÜL KADİR GÖRÜR
- Urdu news categorization using machine learning approaches
Makine öğrenmesi yaklaşımları kullanarak urduca haberlerin kategorizasyonu
MUHAMMAD TALHA SATTI
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBEYKOZ ÜNİVERSİTESİBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. ÖZLEM FEYZA ERKAN
- Hastane yataklarında konfor kavramının incelenmesi
Examination of hospital beds in terms of comfort
GÜZİDE GÜZELBEY
Yüksek Lisans
Türkçe
2016
Endüstri Ürünleri Tasarımıİstanbul Teknik ÜniversitesiEndüstri Ürünleri Tasarımı Ana Bilim Dalı
YRD. DOÇ. DR. EKREM CEM ALPPAY
- Improving diversity of search results for the National Library of Turkey
Millî Kütüphane arama sonuçlarında konu çeşitlendirme iyileştirmesi
CEYDA OKUYAN
Yüksek Lisans
İngilizce
2021
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolTED Üniversitesiİnteraktif Bilişim Sistemleri Ana Bilim Dalı
DR. ÖĞR. ÜYESİ TAYFUN KÜÇÜKYILMAZ