Geri Dön

Yapay sinir ağları ile bankacılık dokümanlarının sınıflandırılması

Classification of banking documents with artificial neural networks

  1. Tez No: 682061
  2. Yazar: ALİ ESER
  3. Danışmanlar: DOÇ. DR. ABDULLAH ERDAL TÜMER
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Makine Öğrenmesi, OCR, Sınıflandırma, Classification, Machine Learning, OCR
  7. Yıl: 2021
  8. Dil: Türkçe
  9. Üniversite: Necmettin Erbakan Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Endüstri Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 72

Özet

Teknolojide yaşanan gelişmelerle birlikte gün geçtikçe dijital ortamdaki belgeler artmaktadır. Artan belgelerin belli bir düzen içinde sınıflandırmak için insan gücüne her geçen gün daha fazla ihtiyaç duyulmaktadır. Özellikle şirketlerin müşteri verilerini düzgün kayıt edilmesi, müşteri taleplerine hızlı bir şekilde cevap verilmesi, şirketin hem yasal olarak hem de özel işlerinin düzenli takip edilebilmesi oldukça önemlidir. Bu gibi insan gücüne ihtiyacın arttığı süreçlerde özellikle kurumsal şirketler müşterilerine sunduğu hizmetlerde yazılım gücünü etkin bir şekilde kullanmaya çalışmaktadır. Bu tezde, taranan dokümanların sınıflandırılması değerlendirilmektedir. Tezin başlıca amacı başarılı sayılabilecek bir doğrulukla resimden metine çevirme işlemi olan Optical Character Recognation (OCR) işleminin yapılması ve yapay zekâ algoritmalarından en uygun algoritma ile de metinlerin sınıflandırılması işlemidir. Taranan dokümanların resim formatından metin haline dönüştürülmesi için Windows OCR kütüphanesi kullanılmıştır. Bu kütüphane sayesinde hem hız olarak hem de doğruluk anlamında başarı elde edilmiştir. El yazısı harici bilgisayar yazısı olan dokümanlarda bu başarı oranı daha da yükselmektedir. Metin haline dönüştürülmüş dokümanların sınıflandırma işlemi .NET platformuna 2018 yılında dahil olan açık kaynak kodlu olan ML.NET makine öğrenmesi kütüphanesidir. ML.NET kütüphanesi açık kaynak kodlu olması, yeni araştırmalara açık olması, kullanıldığı makine de internet bağlantısı gerektirmemesi, hız ve başarı oranı yüksek olduğu için seçilmiştir. Araştırmanın kodları ile farklı sürümlerle güncellenebilmesi, farklı ortamlarda test edilebilmesi ve bu çalışma üzerine ileride daha yeni geliştirmelerin başkaları tarafından da yapılabilmesi için Github üzerinde tutulmuştur. Geliştirilen yazılım ile taranan dokümanlar %97 başarı ile metin haline dönüştürülmüştür. Metin halindeki dokümanların sınıflandırılması işlemindeki başarı oranı ise %92'dir. Dokümanları temsil eden özelliklerin oluşmasında belgede geçen kelimelerin tekrarı önem arz etmektedir. Kimlik, ehliyet, ruhsat gibi aynı türdeki dokümanların belli kalıptaki kelimeleri barındırdığından, sınıflandırılma işlemi de başarılı olmuştur. Ayrıca tarama kalitesinin iyi olması ve taranan dokümanların bilgisayar yazısı ile hazırlanmış olması OCR işleminin daha başarılı olmasını sağlamıştır. Başarı oranını artırmıştır. Bu yazılımın özellikle kullanıcı/müşteriden evrak istendiği bankacılık vb. sektörlerde başarılı bir şekilde kullanılabileceği düşünülmektedir. Geliştirilen yazılıma patent alınması ve ticarileşmesi için de çalışmalar yapılacaktır.

Özet (Çeviri)

With the developments in technology, the documents in the digital environment are increasing day by day. Manpower is needed more and more every day in order to classify the increasing documents in a certain order. It is especially important for companies to properly record customer data, to respond quickly to customer requests, and to be able to follow up both legal and private affairs of the company regularly. In such processes where the need for manpower increases, especially corporate companies try to use the software power effectively in the services they provide to their customers. In this thesis, the classification of the scanned documents is evaluated. The main purpose of the thesis is the process of Optical Character Recognation (OCR), which is the process of converting from image to text with an accuracy that can be considered successful, and the process of classifying the texts with the most appropriate algorithm from artificial intelligence algorithms. Windows OCR library is used to convert scanned documents from image format to text. Thanks to this library, success has been achieved in terms of both speed and accuracy. This success rate increases even more for documents with handwritten external computer writing. The classification process of documents converted into text is the open source ML.NET machine learning library that was included in the .NET platform in 2018. ML.NET library was chosen because it is open source, open to new researches, does not require internet connection, and has a high speed and success rate. It is kept on Github in order to be updated with different versions with the codes of the research, to be tested in different environments and to be able to make new developments on this work by others in the future. The documents scanned with the developed software were converted into text with 97% success. The success rate in classifying documents in text form is 92%. The repetition of the words in the document is important in the formation of the features that represent the documents. The classification process was also successful, as documents of the same type, such as identity, driver's license, and license, contain certain key words. In addition, good scanning quality and the fact that the scanned documents were prepared with computer text made the OCR process more successful. It has increased the success rate. It is thought that this software can be used successfully in banking etc. sectors where documents are requested from the user / customer. Efforts will also be made to obtain patents and commercialize the developed software.

Benzer Tezler

  1. Yapay sinir ağları ile kripto paraların fiyat modellemesi

    Başlık çevirisi yok

    BERKEHAN ÖMRÜUZUN

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    İşletmeİstanbul Üniversitesi

    İşletme Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ARİF SALDANLI

  2. Yapay sinir ağları ile işletmelerin mali başarısızlıklarının öngörülmesine ilişkin bir çalışma

    Using neural networks to predict corporate financial failure

    ERCAN AKDENİZ

    Yüksek Lisans

    Türkçe

    Türkçe

    2018

    BankacılıkEskişehir Osmangazi Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    PROF. DR. MUZAFFER KAPANOĞLU

  3. Yapay sinir ağları ile kredi skorlama

    Credit scoring with artificial neural network

    BURAK DONEL

    Yüksek Lisans

    Türkçe

    Türkçe

    2012

    Bankacılıkİstanbul Teknik Üniversitesi

    İşletme Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. CUMHUR EKİNCİ

  4. Hibrit yapay sinir ağları yaklaşımı ile kredi skorlama

    A hybrid artificial neural network approach for the credit scoring

    DERYA SOYDANER

    Yüksek Lisans

    Türkçe

    Türkçe

    2014

    BankacılıkMimar Sinan Güzel Sanatlar Üniversitesi

    İstatistik Ana Bilim Dalı

    YRD. DOÇ. DR. OZAN KOCADAĞLI

  5. Vadeli İşlem ve Opsiyon Borsası'nda TL Dolar vadeli işlem sözleşmelerinin gün sonu uzlaşma fiyatının yapay sinir ağları ile tahmini

    Predicting TRY USDollar futures contracts daily settlement price in Turkish derivatives exchange with artificial neural networks

    YÜKSEL AKDAĞ

    Yüksek Lisans

    Türkçe

    Türkçe

    2010

    BankacılıkMarmara Üniversitesi

    Sermaye Piyasası ve Borsa Ana Bilim Dalı

    YRD. DOÇ. İDİL ÖZLEM KOÇ