Geri Dön

Evrişimsel sinir ağları ve metin benzerliği kullanılarak fatura görüntülerinde sınıflandırma

Classification of invoice images by using convolutional neural networks and text similarity

  1. Tez No: 661903
  2. Yazar: ÖMER ARSLAN
  3. Danışmanlar: DR. ÖĞR. ÜYESİ SAİT ALİ UYMAZ
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgi ve Belge Yönetimi, Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Information and Records Management, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2021
  8. Dil: Türkçe
  9. Üniversite: Konya Teknik Üniversitesi
  10. Enstitü: Lisansüstü Eğitim Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 117

Özet

Günümüzde tüm firmalar, çeşitli sebeplerle firma adına yapılan harcamalar için ödeme yapmakta ve ödemeye ait faturalar muhasebe işlemleri sebebiyle saklanmaktadır. Firma büyüdükçe personel sayısı artmakta olup firmanın çalışmakta olduğu tedarikçi firmaların sayısı da buna paralel olarak artmaktadır. Personel ve beraber çalışılan tedarikçi firma sayısının artmasıyla firma adına yapılan harcama miktarı da artmaktadır. Artan harcama miktarına bağlı olarak harcamalara ait fatura sayısı da büyük sayılara ulaşmaktadır. Fatura görüntüleri üzerindeki bilgilere daha sonra tekrar ulaşılabilmesi için üzerindeki bilgilerin saklanması gerekmektedir. Bu bilgilerin saklanması, yasal sebeplerden dolayı da gereklidir. Fiziksel olarak muhasebe birimlerine gönderilen faturalar, muhasebe destek personelleri tarafından dijital ortama aktarılmaktadır. Çok büyük firmalar çok daha fazla faturaya sahip olduklarından dolayı, faturaların dijital ortama aktarımı sırasında çok daha fazla personel gücü sarf edilmektedir. Personellerin devasa miktarda faturaları aktaramadıkları durumlarda ise daha fazla muhasebe personeli işe alınmaktadır. Ayrıca çok fazla faturanın kısıtlı bir zaman içerisinde girildiği zamanlarda giriş sırasında yapılan hata miktarı da artmakta olup düzeltmeler için ayrıca zaman ve iş gücü harcanmaktadır. Bu tez çalışmasının amacı, firma bünyesinde çalışan personeller tarafından gerçekleştirilen fatura giriş işlemlerini otomatik bir hale getirmektir. Bu doğrultuda, derin öğrenme yöntemlerinden biri olan evrişimsel sinir ağları tabanlı bir mimari kurularak faturalar şablonlarına göre sınıflandırılmıştır. Sınıflandırma işlemi, fatura üzerinde yer alan fatura alanlarının konumlarına ve şablon yapısına göre yapılmıştır. Fatura şablonuna göre sınıflandırma yapıldıktan sonra şablonu tespit edilen faturaya OCR uygulanarak fatura üzerindeki karakterler otomatik olarak okunmuş ve doğal dil işleme birimine aktarılmıştır. Fatura görüntüsünden alınan verilerin hangi fatura alanına ait olduğunun tespiti ve fatura üzerindeki konumunun belirlenmesi için doğal dil işleme birimi kullanılmıştır. Minimum personel gücü gerektiren bu sistem sayesinde personellerin fatura girişi sırasında yapması muhtemel olan hata sayısı minimuma ineceğinden fatura giriş süreci çok daha kolay ve güvenli bir hale gelmiş olacaktır.

Özet (Çeviri)

Today, all companies pay for the expenses made on behalf of the company for various reasons and the invoices for the payment are kept for accounting purposes. As the company grows, the number of personnel increases and the number of supplier companies that the company works with increases in parallel. With the increase in the number of personnel and supplier companies, the amount of expenditure on behalf of the company also increases. Depending on the increasing amount of expenditure, the number of invoices for expenditures also reaches large numbers. In order to access the information on the invoice images later, the information on the image must be stored. Storage of this information is also necessary for legal reasons. Invoices that are physically sent to the accounting units are transferred to the digital environment manually by the accounting support personnel. Since very large companies will have much more invoices, much more personnel power will be spent during the transfer of invoices to the digital environment. In cases where the staff cannot transfer huge amounts of invoices, more accounting personnel are recruited. In addition, when too many invoices are entered in a limited time, the amount of error made during entry also increases and additional time and effort is consumed for corrections. The purpose of this thesis study is to automate the manual invoice entry processes performed by the personnel working within the company. Accordingly, an architecture based on convolutional neural networks, which is one of the deep learning methods, was established and invoices were classified according to their templates. The classification process is made according to the location of the invoice fields on the invoice and the template structure. After the invoice is classified according to the template, OCR is applied to the invoice whose template has been determined, and the characters on the invoice are automatically read and transferred to the natural language processing unit. Natural language processing unit was used to determine which invoice field belongs to the data taken from the invoice image and to determine its position on the invoice. With the new method that requires minimum personnel power, the number of possible mistakes that the personnel may make during entry will be minimized, and the invoice entry process will become much easier and safer.

Benzer Tezler

  1. Derin öğrenme yöntemleri ile zaman serisi tahmini

    Time series classification with deep learning methods

    HAKAN GÜNDÜZ

    Doktora

    Türkçe

    Türkçe

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. ZEHRA ÇATALTEPE

  2. Multi-label classification of text document using deep learning

    Derin öğrenme kullanan metin belgelerinin çoklu etiket sınıflandırılması

    HAMZA HARUNA MOHAMMED

    Yüksek Lisans

    İngilizce

    İngilizce

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolÇankaya Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ABDÜL KADİR GÖRÜR

    DR. ÖĞR. ÜYESİ ROYA CHOUPANI

  3. Application of data mining techniques in software engineering

    Yazılım mühendisliğinde veri madenciliği tekniklerinin uygulanması

    ELİFE ÖZTÜRK KIYAK

    Doktora

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolDokuz Eylül Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. DERYA BİRANT

  4. Turkish medical text parsing and classification

    Türkçe medikal metin ayrıştırma ve sınıflandırma

    AHMET BARDIZ

    Yüksek Lisans

    İngilizce

    İngilizce

    2019

    Bilim ve TeknolojiGalatasaray Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ İSMAİL BURAK PARLAK

  5. Pattern recognition applications for image classification

    Görüntü sınıflandırma için örüntü tanıma uygulamaları

    MERT ÇETİNKAYA

    Yüksek Lisans

    İngilizce

    İngilizce

    2021

    Endüstri ve Endüstri MühendisliğiBoğaziçi Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    DOÇ. DR. WOLFGANG HÖRMANN