Information extraction from sales flyers using semi-supervised learning
Yarı denetimli öğrenme kullanılarak satış broşürlerinden bilgi çıkarımı
- Tez No: 604454
- Danışmanlar: DR. ÖĞR. ÜYESİ YAKUP GENÇ
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2019
- Dil: İngilizce
- Üniversite: Gebze Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 56
Özet
Nesnelerin ve metinlerin algılanması ve bunların imgelerden çıkarılması, son 30 yılda hala mükemmelleştirmeye çalıştığımız büyük bir zorluk oldu. Görüntü öğreniminde Derin Öğrenme ve Makine Öğrenimi tekniklerindeki mevcut ilerleme ve özellikle satış broşürleri gibi birçok bilgiye sahip olan görüntü için amaç lokalizasyonu, amaç son yarım on yılda bir tartışma konusu olmuştur ve son zamanlarda çok parlak gelişmeler görmüştük. bu alt-görevlerden en az birini çözmeye çalışmakta ve yerelleştirmeyi ve resimlerden ve dijital belgelerden satış broşürleri olarak tanınmasını hedeflemektedir. Bu tezde, satış broşürlerinden bilgi çıkarımı için 3 adımdan oluşan otomatik bir öğrenme algoritması sunduk: birincisi, daha hızlı bölge evrişimsel sinir ağı (Faster RCNN) çerçevesinden ilham alan satış broşürlerinde nesnelerin (Ürünler) tespiti ve Özellik haritası olarak Artık Sinir Ağı. İkinci adım, satış broşürlerindeki metnin Optik karakter tanıma yöntemiyle algılanması ve çıkarılması ve son olarak her bir ürünün fiyat ve açıklama gibi bilgilerle birleştirilmesi amacıyla birleştirme algoritmasıdır. Üç farklı birleştirme algoritması sunduk ve bunları aralarında karşılaştırdık: İşlev algoritması (1) (nesne ve metin arasındaki mesafelerle birleştirme)% 74,% 64 Geri Çağırma, F1 Puanı% 69 ve Doğruluk% 67 kesinliğe ulaştı. İşlev algoritması (2) (Nesne, metin ve nesne üzerindeki metin arasındaki mesafelerle birleştirme)% 76,% 70'i Geri Çağırma, F1 Skoru% 73 ve Doğruluk% 71 kesinliğe ulaştı ve ana katkımız Convolutional sinir ağı CNN'in birleşimi oldu. ve Çok Katmanlı Perceptron (MLP)% 85, Geri Çağırma% 80, F1 Skoru% 82 ve Doğruluk% 81'i buldu.
Özet (Çeviri)
The detection of objects and texts as well as the extraction of them from images has been an enormous challenge that we are still trying to perfect for the past three decades. The current progress in deep learning and machine learning techniques in image classification and object localization particularly for images ,which has a lot of information as sales flyers, has been a topic of discussion in the last half-decade and we have seen some brilliant advancements in recent times which try to solve at least one of these sub-tasks text and object localization and recognition from images and digital documents as sale flyers. In this thesis we presented an automatic learning algorithm for information extraction from sales flyers, which consists of 3 steps: the first is, the detection of objects (Products) in the sales flyers inspired by the faster region convolutional neural network (Faster RCNN) framework and Residual Neural Network as feature map. The second step is, the detection and extraction of the text in the sale flyers by optical character recognition and finally the merge algorithm to merge each product with its information such as price and description. We presented three different merge algorithms and compared them: The function algorithm (1) (merge by distances between object and text) achieved a precision 74%, Recall 64%, F1 Score 69% and Accuracy 67%. The function algorithm (2) (merge by distances between Object, text and text on the object) achieved a precision 76%, Recall 70%, F1 Score 73% and Accuracy 71%. The main contribution of this thesis been the combination of Convolutional neural network (CNN) and Multilayer Perceptron (MLP) achieved a precision 85%, Recall 80%, F1 Score 82% and Accuracy 81%.
Benzer Tezler
- Birliktelik kuralı algoritmaları ile büyük veriler üzerinde analitik analizler: Havaalanı örneği
Analytical analyses on big data with association rulealgorithms: Airport example
MESUT ZERMAN
Yüksek Lisans
Türkçe
2018
Bilim ve TeknolojiHaliç ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ FARUK BULUT
- Apriori algoritması ile kitap oylamaları analizi
Book voting analysis of Apriori algorithm
MERVE KÖLE
Yüksek Lisans
Türkçe
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolManisa Celal Bayar ÜniversitesiYazılım Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ EMİN BORANDAĞ
- Brain epileptic seizure diagnosis using electroencephalographic EEG signals
Başlık çevirisi yok
MOHAMMED AYDEN OMAR BASWAN
Yüksek Lisans
İngilizce
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAltınbaş ÜniversitesiBilişim Teknolojileri Ana Bilim Dalı
DR. ÖĞR. ÜYESİ SEFER KURNAZ
- Web 3.0 teknolojileri i̇le sosyal medya veri anlamlandirmasina yönelik bir model geliştirme
Developing a model for social media data semantics with web 3.0 technologies
VALA GASHI ADIGÜZELLİ
Doktora
Türkçe
2024
Bilgi ve Belge Yönetimiİstanbul ÜniversitesiFen Bilimleri Ana Bilim Dalı
PROF. DR. SEVİNÇ GÜLSEÇEN
- Dikili ağaç satışlarının üretim süreci açısından değerlendirilmesi (Alanya orman işletme müdürlüğü örneği)
Evaluation of stumpage sales in terms of the harvesting process (case of Alanya directorate of forest enterprise)
RECEP HASAN ŞAHİN
Yüksek Lisans
Türkçe
2023
Ormancılık ve Orman MühendisliğiIsparta Uygulamalı Bilimler ÜniversitesiOrman Mühendisliği Ana Bilim Dalı
PROF. DR. MEHMET EKER