Resim formatindaki dijital dokümanlarin bilgisayar görüsü ve makine öğrenmesi yöntemleri kullanilarak LaTex formatina çevrilmesi
Converting digital documents in image format to LaTex format using computer vision and machine learning methods
- Tez No: 734725
- Danışmanlar: DR. ÖĞR. ÜYESİ MUSTAFA DAĞTEKİN
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2022
- Dil: Türkçe
- Üniversite: İstanbul Üniversitesi-Cerrahpaşa
- Enstitü: Lisansüstü Eğitim Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
- Sayfa Sayısı: 78
Özet
Günümüzde kâğıda basılı belgelerin yerini dijital dokümanlar almıştır. Bunlar resim biçiminde veya özel dosya formatları şeklinde olabilmektedir. Yaygın olarak kullanılan kelime işlemci programları genel kitleye hitap eder ve bu programların kullanımları en basit düzeyde tutulmuştur. LaTex dosya formatı kullanılarak hazırlanan dokümanlar profesyonel düzeyde detaylı içerikler hazırlanmasını sağlamaktadır. LaTex dosya formatı özellikle kitap ve akademik dokümanların yazımında tercih edilmektedir. Akademik çevrelerce tercih edilen bu dosya formatının bir dezavantajı vardır. Doküman oluşturulurken kod yazılması gerekmektedir. Bu işlem çoğu kullanıcı için sorun olmaktadır. Resim formatındaki bir dokümandan LaTex kodunun üretilmesi bilgisayarlı görü ve doğal dil işleme alanlarının birlikte kullanılmasını gerektirmektedir. Bu çalışmada öncelikle resim üzerinde metin, tablo ve şekillerin bulunduğu yerlerin sınırları (bloklar) tespit edilmiştir. Sonrasında bulunan bu blokların doğal dil işleme metotları ile metinlerin sınıfları tespit edilmiştir. LaTex kodu oluşturulacak dokümanın akışının bozulmaması için okuma sırası tespit edilmiştir. Son aşama olarak tüm bilgiler kullanılarak LaTex kodu üretilmiştir.
Özet (Çeviri)
Nowadays, digital documents have steadily replacing printed documents. These documents can be in dijital images or in custom file format. Widely used word processing programs appeal to the general audience and their use has been developed to be as a simple to use as possible for the end user. Documents prepared using LaTex file format provide a more professional-level content. The LaTex file format is especially preferred for the writing books and academic documents. This file format, which is preferred by academic circles, has a drawback. Code must be written when creating the document. This process is a problem for most users. Generating LaTex code from an image-formatted document requires both the use of computer vision and natural language processing areas. In this study, the boundaries (blocks) of the places where text, tables and figures are located on the picture were found out. The natural language processing methods and classes of the texts were detected in these blocks afterwards. The reading order has been determined so that the flow of the document to be created in LaTex code is not disrupted. As a final stage, LaTex code is generated using all the information available.
Benzer Tezler
- Yapay sinir ağları ile bankacılık dokümanlarının sınıflandırılması
Classification of banking documents with artificial neural networks
ALİ ESER
Yüksek Lisans
Türkçe
2021
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolNecmettin Erbakan ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
DOÇ. DR. ABDULLAH ERDAL TÜMER
- Event extraction from Turkish Trade Registry Gazette
Türkiye Ticaret Sicili Gazetesi'nden olay çıkarımı
İREM NUR DEMİRTAŞ
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. GÜLŞEN ERYİĞİT
- Esnek resim damgalama: Blok tabanlı damgalama analizi, vektör damgası kullanımı ve doğrulama damgalamasının geliştirilmesi
Resilient image watermarking: Block-based image watermarking analysis, using vector image as watermark and improving authentication purpose watermarking
AHMET ŞENOL
Doktora
Türkçe
2018
Bilgi ve Belge YönetimiHacettepe ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. HAYRİ SEVER
- İlkokul dördüncü sınıf Türkçe dersinde dinleme becerilerinin geliştirilmesinde dijital hikayelerin kullanılması
The use of digital stories to develop listening skills in the elementary school fourth grade Turkish course
FATİH MEHMET CİĞERCİ
Doktora
Türkçe
2015
Eğitim ve ÖğretimAnadolu Üniversitesiİlköğretim Ana Bilim Dalı
PROF. DR. MEHMET GÜLTEKİN
- Interactive parallel video editing using FPGA structures
FPGA yapıları kullanarak paralel etkileşimli video editleme
OKAN ÇOBANOĞLU
Yüksek Lisans
İngilizce
2011
Elektrik ve Elektronik MühendisliğiDokuz Eylül ÜniversitesiElektrik ve Elektronik Mühendisliği Bölümü
YRD. DOÇ. DR. AHMET ÖZKURT