Makine öğrenmesi ile belge tanıma
Document recognition with machine learning
- Tez No: 886223
- Danışmanlar: DR. ÖĞR. ÜYESİ MUHAMMET ÇAKMAK
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2024
- Dil: Türkçe
- Üniversite: Karabük Üniversitesi
- Enstitü: Lisansüstü Eğitim Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 46
Özet
Gümrük, bir ülkenin sınırlarından eşya ve malların giriş ve çıkışlarında denetimlerin yapıldığı ve vergilerin ödendiği bir kamu kurumu olarak tanımlanabilir. Gümrük beyannameleri, bu süreçte önemli bir rol oynar çünkü gümrük vergisinin toplanmasını sağlar. Gümrük beyannameleri üzerinden alınan gümrük vergisi, uluslararası ticarette eşyanın ithali ya da ihracına bağlı olarak öngörülen vergilerden sadece birini oluşturur. Bu, gümrük işlemlerinin düzgün bir şekilde yürütülmesi ve uluslararası ticaretin düzenli bir şekilde gerçekleştirilmesi için kritik öneme sahiptir. Gümrük beyannamelerinin hatasız bir şekilde yazılması, bu sürecin etkinliği ve doğruluğu açısından büyük önem taşır. Beyannamenin yazılmasında kullanılan metod çeşitliliği ve karmaşıklığı, insan kaynaklı hataların oluşmasına neden olabilir. Bu nedenle, bu sürecin otomatikleştirilmesi ve makine öğrenmesi teknolojilerinin kullanılması, bu tür hataları önlemeye yardımcı olabilir. Makine öğrenmesi teknolojileri, özellikle gümrük beyannamelerinin doğruluğunu artırarak, uluslararası ticaretin daha düzenli ve güvenli bir şekilde yürütülmesine katkıda bulunmaktadır. Bu teknolojiler, aynı zamanda veri işleme sürecini hızlandırmakta ve insan kaynaklı hataları minimize etmektedir. Dijital dönüşüm ve sayısallaştırma süreçleri, kurumların daha verimli çalışmasını sağlarken, maliyetleri düşürmekte ve bilgiye erişimi kolaylaştırmaktadır. Bu tezde makine öğrenmesi yöntemleri ile taranan doküman üzerindeki metinlerin en iyi doğruluk oranı ile sınıflandırılması yapılmıştır. Çalışmada, destek vektör makinesi (SVM), k-en yakın komşu (Knn), karar ağaçları (DT), rastgele orman (RF), eXtreme Gradient Boosting (XGBoost) ve ANN yöntemleri incelenmiştir. En iyi yöntem olarak XGBoost uygulanmış olup, 97.49% başarı oranı elde edilmiştir.
Özet (Çeviri)
Customs can be defined as a public institution where inspections and tax payments occur for goods entering or leaving a country's borders. Customs declarations play a crucial role in this process as they facilitate the collection of customs duties. Customs duties collected through customs declarations constitute only one of the taxes envisaged depending on whether goods are imported or exported in international trade. Therefore, it is of critical importance for customs procedures to be conducted properly and for international trade to be conducted regularly. The accurate completion of customs declarations is crucial for the efficiency and accuracy of this process. The variety and complexity of methods used in drafting declarations can lead to human errors. Hence, automating this process and utilizing machine learning technologies can help prevent such errors. Machine learning technologies contribute significantly to enhancing the accuracy of customs declarations, thereby facilitating more orderly and secure international trade. These technologies also expedite data processing and minimize human errors. Digital transformation and digitization processes enable institutions to operate more efficiently, reduce costs, and facilitate access to information. In this study, text classification of scanned documents using machine learning methods was conducted to achieve the highest accuracy rate. The study examined Support Vector Machines (SVM), k-Nearest Neighbors (KNN), Decision Trees (DT), Random Forests (RF), eXtreme Gradient Boosting (XGBoost), and Artificial Neural Networks (ANN). XGBoost was implemented as the best method, achieving a success rate of 97.49%.
Benzer Tezler
- Konuşmacı tanıma metinsel kayıt ve analiz sisteminin oluşturulması
Creating a model for text-dependent speaker diarization
AMMAR AHMED ABDO SAEED
Yüksek Lisans
Türkçe
2022
Bilgi ve Belge YönetimiMuğla Sıtkı Koçman ÜniversitesiBilişim Sistemleri Mühendisliği Ana Bilim Dalı
DOÇ. DR. HÜSEYİN GÜRÜLER
- Neural language modelling approaches for post-ocr text processing
Optik karakter tanıma sonrası metin işleme adımı için sinirsel dil modelleri yaklaşımları
AYŞE İREM TOPÇU
Yüksek Lisans
İngilizce
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Bilimleri Ana Bilim Dalı
PROF. DR. BEHÇET UĞUR TÖREYİN
- Author identification with transfer learning
Transfer öğrenimi ile yazar tanıma
İBRAHİM YÜLÜCE
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolDokuz Eylül ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ FERİŞTAH DALKILIÇ
- Web tabanlı metinlerde yazarın anadilini tanımlama
Authors native language identification in web mediums
PARHAM MOHAMMADALİPOUR TOFİGHİ
Yüksek Lisans
Türkçe
2012
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKaradeniz Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. CEMAL KÖSE
- Sign language recognition with zero-shot learning
Sıfır-atış öğrenmesi ile işaret dili tanıma
GİRAY SERCAN ÖZCAN
Doktora
İngilizce
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBaşkent ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. EMRE SÜMER
DR. YUNUS CAN BİLGE