Geri Dön

Makine öğrenmesi ile belge tanıma

Document recognition with machine learning

  1. Tez No: 886223
  2. Yazar: İSA YURDABAKAN
  3. Danışmanlar: DR. ÖĞR. ÜYESİ MUHAMMET ÇAKMAK
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2024
  8. Dil: Türkçe
  9. Üniversite: Karabük Üniversitesi
  10. Enstitü: Lisansüstü Eğitim Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 46

Özet

Gümrük, bir ülkenin sınırlarından eşya ve malların giriş ve çıkışlarında denetimlerin yapıldığı ve vergilerin ödendiği bir kamu kurumu olarak tanımlanabilir. Gümrük beyannameleri, bu süreçte önemli bir rol oynar çünkü gümrük vergisinin toplanmasını sağlar. Gümrük beyannameleri üzerinden alınan gümrük vergisi, uluslararası ticarette eşyanın ithali ya da ihracına bağlı olarak öngörülen vergilerden sadece birini oluşturur. Bu, gümrük işlemlerinin düzgün bir şekilde yürütülmesi ve uluslararası ticaretin düzenli bir şekilde gerçekleştirilmesi için kritik öneme sahiptir. Gümrük beyannamelerinin hatasız bir şekilde yazılması, bu sürecin etkinliği ve doğruluğu açısından büyük önem taşır. Beyannamenin yazılmasında kullanılan metod çeşitliliği ve karmaşıklığı, insan kaynaklı hataların oluşmasına neden olabilir. Bu nedenle, bu sürecin otomatikleştirilmesi ve makine öğrenmesi teknolojilerinin kullanılması, bu tür hataları önlemeye yardımcı olabilir. Makine öğrenmesi teknolojileri, özellikle gümrük beyannamelerinin doğruluğunu artırarak, uluslararası ticaretin daha düzenli ve güvenli bir şekilde yürütülmesine katkıda bulunmaktadır. Bu teknolojiler, aynı zamanda veri işleme sürecini hızlandırmakta ve insan kaynaklı hataları minimize etmektedir. Dijital dönüşüm ve sayısallaştırma süreçleri, kurumların daha verimli çalışmasını sağlarken, maliyetleri düşürmekte ve bilgiye erişimi kolaylaştırmaktadır. Bu tezde makine öğrenmesi yöntemleri ile taranan doküman üzerindeki metinlerin en iyi doğruluk oranı ile sınıflandırılması yapılmıştır. Çalışmada, destek vektör makinesi (SVM), k-en yakın komşu (Knn), karar ağaçları (DT), rastgele orman (RF), eXtreme Gradient Boosting (XGBoost) ve ANN yöntemleri incelenmiştir. En iyi yöntem olarak XGBoost uygulanmış olup, 97.49% başarı oranı elde edilmiştir.

Özet (Çeviri)

Customs can be defined as a public institution where inspections and tax payments occur for goods entering or leaving a country's borders. Customs declarations play a crucial role in this process as they facilitate the collection of customs duties. Customs duties collected through customs declarations constitute only one of the taxes envisaged depending on whether goods are imported or exported in international trade. Therefore, it is of critical importance for customs procedures to be conducted properly and for international trade to be conducted regularly. The accurate completion of customs declarations is crucial for the efficiency and accuracy of this process. The variety and complexity of methods used in drafting declarations can lead to human errors. Hence, automating this process and utilizing machine learning technologies can help prevent such errors. Machine learning technologies contribute significantly to enhancing the accuracy of customs declarations, thereby facilitating more orderly and secure international trade. These technologies also expedite data processing and minimize human errors. Digital transformation and digitization processes enable institutions to operate more efficiently, reduce costs, and facilitate access to information. In this study, text classification of scanned documents using machine learning methods was conducted to achieve the highest accuracy rate. The study examined Support Vector Machines (SVM), k-Nearest Neighbors (KNN), Decision Trees (DT), Random Forests (RF), eXtreme Gradient Boosting (XGBoost), and Artificial Neural Networks (ANN). XGBoost was implemented as the best method, achieving a success rate of 97.49%.

Benzer Tezler

  1. Konuşmacı tanıma metinsel kayıt ve analiz sisteminin oluşturulması

    Creating a model for text-dependent speaker diarization

    AMMAR AHMED ABDO SAEED

    Yüksek Lisans

    Türkçe

    Türkçe

    2022

    Bilgi ve Belge YönetimiMuğla Sıtkı Koçman Üniversitesi

    Bilişim Sistemleri Mühendisliği Ana Bilim Dalı

    DOÇ. DR. HÜSEYİN GÜRÜLER

  2. Neural language modelling approaches for post-ocr text processing

    Optik karakter tanıma sonrası metin işleme adımı için sinirsel dil modelleri yaklaşımları

    AYŞE İREM TOPÇU

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Bilimleri Ana Bilim Dalı

    PROF. DR. BEHÇET UĞUR TÖREYİN

  3. Author identification with transfer learning

    Transfer öğrenimi ile yazar tanıma

    İBRAHİM YÜLÜCE

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolDokuz Eylül Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ FERİŞTAH DALKILIÇ

  4. Web tabanlı metinlerde yazarın anadilini tanımlama

    Authors native language identification in web mediums

    PARHAM MOHAMMADALİPOUR TOFİGHİ

    Yüksek Lisans

    Türkçe

    Türkçe

    2012

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKaradeniz Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. CEMAL KÖSE

  5. Sign language recognition with zero-shot learning

    Sıfır-atış öğrenmesi ile işaret dili tanıma

    GİRAY SERCAN ÖZCAN

    Doktora

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBaşkent Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. EMRE SÜMER

    DR. YUNUS CAN BİLGE