Makine öğrenmesi ile belge tanıma

Document recognition with machine learning

PDF İndir

Tez No: 886223
Yazar: İSA YURDABAKAN
Danışmanlar: DR. ÖĞR. ÜYESİ MUHAMMET ÇAKMAK
Tez Türü: Yüksek Lisans
Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
Anahtar Kelimeler: Belirtilmemiş.
Yıl: 2024
Dil: Türkçe
Üniversite: Karabük Üniversitesi
Enstitü: Lisansüstü Eğitim Enstitüsü
Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
Bilim Dalı: Belirtilmemiş.
Sayfa Sayısı: 46

Özet

Gümrük, bir ülkenin sınırlarından eşya ve malların giriş ve çıkışlarında denetimlerin yapıldığı ve vergilerin ödendiği bir kamu kurumu olarak tanımlanabilir. Gümrük beyannameleri, bu süreçte önemli bir rol oynar çünkü gümrük vergisinin toplanmasını sağlar. Gümrük beyannameleri üzerinden alınan gümrük vergisi, uluslararası ticarette eşyanın ithali ya da ihracına bağlı olarak öngörülen vergilerden sadece birini oluşturur. Bu, gümrük işlemlerinin düzgün bir şekilde yürütülmesi ve uluslararası ticaretin düzenli bir şekilde gerçekleştirilmesi için kritik öneme sahiptir. Gümrük beyannamelerinin hatasız bir şekilde yazılması, bu sürecin etkinliği ve doğruluğu açısından büyük önem taşır. Beyannamenin yazılmasında kullanılan metod çeşitliliği ve karmaşıklığı, insan kaynaklı hataların oluşmasına neden olabilir. Bu nedenle, bu sürecin otomatikleştirilmesi ve makine öğrenmesi teknolojilerinin kullanılması, bu tür hataları önlemeye yardımcı olabilir. Makine öğrenmesi teknolojileri, özellikle gümrük beyannamelerinin doğruluğunu artırarak, uluslararası ticaretin daha düzenli ve güvenli bir şekilde yürütülmesine katkıda bulunmaktadır. Bu teknolojiler, aynı zamanda veri işleme sürecini hızlandırmakta ve insan kaynaklı hataları minimize etmektedir. Dijital dönüşüm ve sayısallaştırma süreçleri, kurumların daha verimli çalışmasını sağlarken, maliyetleri düşürmekte ve bilgiye erişimi kolaylaştırmaktadır. Bu tezde makine öğrenmesi yöntemleri ile taranan doküman üzerindeki metinlerin en iyi doğruluk oranı ile sınıflandırılması yapılmıştır. Çalışmada, destek vektör makinesi (SVM), k-en yakın komşu (Knn), karar ağaçları (DT), rastgele orman (RF), eXtreme Gradient Boosting (XGBoost) ve ANN yöntemleri incelenmiştir. En iyi yöntem olarak XGBoost uygulanmış olup, 97.49% başarı oranı elde edilmiştir.

Özet (Çeviri)

Customs can be defined as a public institution where inspections and tax payments occur for goods entering or leaving a country's borders. Customs declarations play a crucial role in this process as they facilitate the collection of customs duties. Customs duties collected through customs declarations constitute only one of the taxes envisaged depending on whether goods are imported or exported in international trade. Therefore, it is of critical importance for customs procedures to be conducted properly and for international trade to be conducted regularly. The accurate completion of customs declarations is crucial for the efficiency and accuracy of this process. The variety and complexity of methods used in drafting declarations can lead to human errors. Hence, automating this process and utilizing machine learning technologies can help prevent such errors. Machine learning technologies contribute significantly to enhancing the accuracy of customs declarations, thereby facilitating more orderly and secure international trade. These technologies also expedite data processing and minimize human errors. Digital transformation and digitization processes enable institutions to operate more efficiently, reduce costs, and facilitate access to information. In this study, text classification of scanned documents using machine learning methods was conducted to achieve the highest accuracy rate. The study examined Support Vector Machines (SVM), k-Nearest Neighbors (KNN), Decision Trees (DT), Random Forests (RF), eXtreme Gradient Boosting (XGBoost), and Artificial Neural Networks (ANN). XGBoost was implemented as the best method, achieving a success rate of 97.49%.

Benzer Tezler

Tez No
774117
Konuşmacı tanıma metinsel kayıt ve analiz sisteminin oluşturulması
Creating a model for text-dependent speaker diarization
AMMAR AHMED ABDO SAEED
Yüksek Lisans
Türkçe
2022
Bilgi ve Belge Yönetimi Muğla Sıtkı Koçman Üniversitesi
Bilişim Sistemleri Mühendisliği Ana Bilim Dalı
DOÇ. DR. HÜSEYİN GÜRÜLER
Tez No
740823
Neural language modelling approaches for post-ocr text processing
Optik karakter tanıma sonrası metin işleme adımı için sinirsel dil modelleri yaklaşımları
AYŞE İREM TOPÇU
Yüksek Lisans
İngilizce
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol İstanbul Teknik Üniversitesi
Bilgisayar Bilimleri Ana Bilim Dalı
PROF. DR. BEHÇET UĞUR TÖREYİN
Tez No
829066
Author identification with transfer learning
Transfer öğrenimi ile yazar tanıma
İBRAHİM YÜLÜCE
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol Dokuz Eylül Üniversitesi
Bilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ FERİŞTAH DALKILIÇ
Tez No
315548
Web tabanlı metinlerde yazarın anadilini tanımlama
Authors native language identification in web mediums
PARHAM MOHAMMADALİPOUR TOFİGHİ
Yüksek Lisans
Türkçe
2012
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol Karadeniz Teknik Üniversitesi
Bilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. CEMAL KÖSE
Tez No
898101
Sign language recognition with zero-shot learning
Sıfır-atış öğrenmesi ile işaret dili tanıma
GİRAY SERCAN ÖZCAN
Doktora
İngilizce
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol Başkent Üniversitesi
Bilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. EMRE SÜMER
DR. YUNUS CAN BİLGE

Geri Dön