Evrişimsel sinir ağları ve metin benzerliği kullanılarak fatura görüntülerinde sınıflandırma
Classification of invoice images by using convolutional neural networks and text similarity
- Tez No: 661903
- Danışmanlar: DR. ÖĞR. ÜYESİ SAİT ALİ UYMAZ
- Tez Türü: Yüksek Lisans
- Konular: Bilgi ve Belge Yönetimi, Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Information and Records Management, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2021
- Dil: Türkçe
- Üniversite: Konya Teknik Üniversitesi
- Enstitü: Lisansüstü Eğitim Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 117
Özet
Günümüzde tüm firmalar, çeşitli sebeplerle firma adına yapılan harcamalar için ödeme yapmakta ve ödemeye ait faturalar muhasebe işlemleri sebebiyle saklanmaktadır. Firma büyüdükçe personel sayısı artmakta olup firmanın çalışmakta olduğu tedarikçi firmaların sayısı da buna paralel olarak artmaktadır. Personel ve beraber çalışılan tedarikçi firma sayısının artmasıyla firma adına yapılan harcama miktarı da artmaktadır. Artan harcama miktarına bağlı olarak harcamalara ait fatura sayısı da büyük sayılara ulaşmaktadır. Fatura görüntüleri üzerindeki bilgilere daha sonra tekrar ulaşılabilmesi için üzerindeki bilgilerin saklanması gerekmektedir. Bu bilgilerin saklanması, yasal sebeplerden dolayı da gereklidir. Fiziksel olarak muhasebe birimlerine gönderilen faturalar, muhasebe destek personelleri tarafından dijital ortama aktarılmaktadır. Çok büyük firmalar çok daha fazla faturaya sahip olduklarından dolayı, faturaların dijital ortama aktarımı sırasında çok daha fazla personel gücü sarf edilmektedir. Personellerin devasa miktarda faturaları aktaramadıkları durumlarda ise daha fazla muhasebe personeli işe alınmaktadır. Ayrıca çok fazla faturanın kısıtlı bir zaman içerisinde girildiği zamanlarda giriş sırasında yapılan hata miktarı da artmakta olup düzeltmeler için ayrıca zaman ve iş gücü harcanmaktadır. Bu tez çalışmasının amacı, firma bünyesinde çalışan personeller tarafından gerçekleştirilen fatura giriş işlemlerini otomatik bir hale getirmektir. Bu doğrultuda, derin öğrenme yöntemlerinden biri olan evrişimsel sinir ağları tabanlı bir mimari kurularak faturalar şablonlarına göre sınıflandırılmıştır. Sınıflandırma işlemi, fatura üzerinde yer alan fatura alanlarının konumlarına ve şablon yapısına göre yapılmıştır. Fatura şablonuna göre sınıflandırma yapıldıktan sonra şablonu tespit edilen faturaya OCR uygulanarak fatura üzerindeki karakterler otomatik olarak okunmuş ve doğal dil işleme birimine aktarılmıştır. Fatura görüntüsünden alınan verilerin hangi fatura alanına ait olduğunun tespiti ve fatura üzerindeki konumunun belirlenmesi için doğal dil işleme birimi kullanılmıştır. Minimum personel gücü gerektiren bu sistem sayesinde personellerin fatura girişi sırasında yapması muhtemel olan hata sayısı minimuma ineceğinden fatura giriş süreci çok daha kolay ve güvenli bir hale gelmiş olacaktır.
Özet (Çeviri)
Today, all companies pay for the expenses made on behalf of the company for various reasons and the invoices for the payment are kept for accounting purposes. As the company grows, the number of personnel increases and the number of supplier companies that the company works with increases in parallel. With the increase in the number of personnel and supplier companies, the amount of expenditure on behalf of the company also increases. Depending on the increasing amount of expenditure, the number of invoices for expenditures also reaches large numbers. In order to access the information on the invoice images later, the information on the image must be stored. Storage of this information is also necessary for legal reasons. Invoices that are physically sent to the accounting units are transferred to the digital environment manually by the accounting support personnel. Since very large companies will have much more invoices, much more personnel power will be spent during the transfer of invoices to the digital environment. In cases where the staff cannot transfer huge amounts of invoices, more accounting personnel are recruited. In addition, when too many invoices are entered in a limited time, the amount of error made during entry also increases and additional time and effort is consumed for corrections. The purpose of this thesis study is to automate the manual invoice entry processes performed by the personnel working within the company. Accordingly, an architecture based on convolutional neural networks, which is one of the deep learning methods, was established and invoices were classified according to their templates. The classification process is made according to the location of the invoice fields on the invoice and the template structure. After the invoice is classified according to the template, OCR is applied to the invoice whose template has been determined, and the characters on the invoice are automatically read and transferred to the natural language processing unit. Natural language processing unit was used to determine which invoice field belongs to the data taken from the invoice image and to determine its position on the invoice. With the new method that requires minimum personnel power, the number of possible mistakes that the personnel may make during entry will be minimized, and the invoice entry process will become much easier and safer.
Benzer Tezler
- Derin öğrenme yöntemleri ile zaman serisi tahmini
Time series classification with deep learning methods
HAKAN GÜNDÜZ
Doktora
Türkçe
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. ZEHRA ÇATALTEPE
- Multi-label classification of text document using deep learning
Derin öğrenme kullanan metin belgelerinin çoklu etiket sınıflandırılması
HAMZA HARUNA MOHAMMED
Yüksek Lisans
İngilizce
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolÇankaya ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ABDÜL KADİR GÖRÜR
DR. ÖĞR. ÜYESİ ROYA CHOUPANI
- Application of data mining techniques in software engineering
Yazılım mühendisliğinde veri madenciliği tekniklerinin uygulanması
ELİFE ÖZTÜRK KIYAK
Doktora
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolDokuz Eylül ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. DERYA BİRANT
- Turkish medical text parsing and classification
Türkçe medikal metin ayrıştırma ve sınıflandırma
AHMET BARDIZ
Yüksek Lisans
İngilizce
2019
Bilim ve TeknolojiGalatasaray ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ İSMAİL BURAK PARLAK
- Pattern recognition applications for image classification
Görüntü sınıflandırma için örüntü tanıma uygulamaları
MERT ÇETİNKAYA
Yüksek Lisans
İngilizce
2021
Endüstri ve Endüstri MühendisliğiBoğaziçi ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
DOÇ. DR. WOLFGANG HÖRMANN