Geri Dön

Information extraction from sales flyers using semi-supervised learning

Yarı denetimli öğrenme kullanılarak satış broşürlerinden bilgi çıkarımı

  1. Tez No: 604454
  2. Yazar: HARLINTON PALACIOS MOSQUERA
  3. Danışmanlar: DR. ÖĞR. ÜYESİ YAKUP GENÇ
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2019
  8. Dil: İngilizce
  9. Üniversite: Gebze Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 56

Özet

Nesnelerin ve metinlerin algılanması ve bunların imgelerden çıkarılması, son 30 yılda hala mükemmelleştirmeye çalıştığımız büyük bir zorluk oldu. Görüntü öğreniminde Derin Öğrenme ve Makine Öğrenimi tekniklerindeki mevcut ilerleme ve özellikle satış broşürleri gibi birçok bilgiye sahip olan görüntü için amaç lokalizasyonu, amaç son yarım on yılda bir tartışma konusu olmuştur ve son zamanlarda çok parlak gelişmeler görmüştük. bu alt-görevlerden en az birini çözmeye çalışmakta ve yerelleştirmeyi ve resimlerden ve dijital belgelerden satış broşürleri olarak tanınmasını hedeflemektedir. Bu tezde, satış broşürlerinden bilgi çıkarımı için 3 adımdan oluşan otomatik bir öğrenme algoritması sunduk: birincisi, daha hızlı bölge evrişimsel sinir ağı (Faster RCNN) çerçevesinden ilham alan satış broşürlerinde nesnelerin (Ürünler) tespiti ve Özellik haritası olarak Artık Sinir Ağı. İkinci adım, satış broşürlerindeki metnin Optik karakter tanıma yöntemiyle algılanması ve çıkarılması ve son olarak her bir ürünün fiyat ve açıklama gibi bilgilerle birleştirilmesi amacıyla birleştirme algoritmasıdır. Üç farklı birleştirme algoritması sunduk ve bunları aralarında karşılaştırdık: İşlev algoritması (1) (nesne ve metin arasındaki mesafelerle birleştirme)% 74,% 64 Geri Çağırma, F1 Puanı% 69 ve Doğruluk% 67 kesinliğe ulaştı. İşlev algoritması (2) (Nesne, metin ve nesne üzerindeki metin arasındaki mesafelerle birleştirme)% 76,% 70'i Geri Çağırma, F1 Skoru% 73 ve Doğruluk% 71 kesinliğe ulaştı ve ana katkımız Convolutional sinir ağı CNN'in birleşimi oldu. ve Çok Katmanlı Perceptron (MLP)% 85, Geri Çağırma% 80, F1 Skoru% 82 ve Doğruluk% 81'i buldu.

Özet (Çeviri)

The detection of objects and texts as well as the extraction of them from images has been an enormous challenge that we are still trying to perfect for the past three decades. The current progress in deep learning and machine learning techniques in image classification and object localization particularly for images ,which has a lot of information as sales flyers, has been a topic of discussion in the last half-decade and we have seen some brilliant advancements in recent times which try to solve at least one of these sub-tasks text and object localization and recognition from images and digital documents as sale flyers. In this thesis we presented an automatic learning algorithm for information extraction from sales flyers, which consists of 3 steps: the first is, the detection of objects (Products) in the sales flyers inspired by the faster region convolutional neural network (Faster RCNN) framework and Residual Neural Network as feature map. The second step is, the detection and extraction of the text in the sale flyers by optical character recognition and finally the merge algorithm to merge each product with its information such as price and description. We presented three different merge algorithms and compared them: The function algorithm (1) (merge by distances between object and text) achieved a precision 74%, Recall 64%, F1 Score 69% and Accuracy 67%. The function algorithm (2) (merge by distances between Object, text and text on the object) achieved a precision 76%, Recall 70%, F1 Score 73% and Accuracy 71%. The main contribution of this thesis been the combination of Convolutional neural network (CNN) and Multilayer Perceptron (MLP) achieved a precision 85%, Recall 80%, F1 Score 82% and Accuracy 81%.

Benzer Tezler

  1. Birliktelik kuralı algoritmaları ile büyük veriler üzerinde analitik analizler: Havaalanı örneği

    Analytical analyses on big data with association rulealgorithms: Airport example

    MESUT ZERMAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2018

    Bilim ve TeknolojiHaliç Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ FARUK BULUT

  2. Apriori algoritması ile kitap oylamaları analizi

    Book voting analysis of Apriori algorithm

    MERVE KÖLE

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolManisa Celal Bayar Üniversitesi

    Yazılım Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ EMİN BORANDAĞ

  3. Brain epileptic seizure diagnosis using electroencephalographic EEG signals

    Başlık çevirisi yok

    MOHAMMED AYDEN OMAR BASWAN

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAltınbaş Üniversitesi

    Bilişim Teknolojileri Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ SEFER KURNAZ

  4. Web 3.0 teknolojileri i̇le sosyal medya veri anlamlandirmasina yönelik bir model geliştirme

    Developing a model for social media data semantics with web 3.0 technologies

    VALA GASHI ADIGÜZELLİ

    Doktora

    Türkçe

    Türkçe

    2024

    Bilgi ve Belge Yönetimiİstanbul Üniversitesi

    Fen Bilimleri Ana Bilim Dalı

    PROF. DR. SEVİNÇ GÜLSEÇEN

  5. Dikili ağaç satışlarının üretim süreci açısından değerlendirilmesi (Alanya orman işletme müdürlüğü örneği)

    Evaluation of stumpage sales in terms of the harvesting process (case of Alanya directorate of forest enterprise)

    RECEP HASAN ŞAHİN

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    Ormancılık ve Orman MühendisliğiIsparta Uygulamalı Bilimler Üniversitesi

    Orman Mühendisliği Ana Bilim Dalı

    PROF. DR. MEHMET EKER