Geri Dön

Resim formatindaki dijital dokümanlarin bilgisayar görüsü ve makine öğrenmesi yöntemleri kullanilarak LaTex formatina çevrilmesi

Converting digital documents in image format to LaTex format using computer vision and machine learning methods

  1. Tez No: 734725
  2. Yazar: MURAT KAZANÇ
  3. Danışmanlar: DR. ÖĞR. ÜYESİ MUSTAFA DAĞTEKİN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2022
  8. Dil: Türkçe
  9. Üniversite: İstanbul Üniversitesi-Cerrahpaşa
  10. Enstitü: Lisansüstü Eğitim Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
  13. Sayfa Sayısı: 78

Özet

Günümüzde kâğıda basılı belgelerin yerini dijital dokümanlar almıştır. Bunlar resim biçiminde veya özel dosya formatları şeklinde olabilmektedir. Yaygın olarak kullanılan kelime işlemci programları genel kitleye hitap eder ve bu programların kullanımları en basit düzeyde tutulmuştur. LaTex dosya formatı kullanılarak hazırlanan dokümanlar profesyonel düzeyde detaylı içerikler hazırlanmasını sağlamaktadır. LaTex dosya formatı özellikle kitap ve akademik dokümanların yazımında tercih edilmektedir. Akademik çevrelerce tercih edilen bu dosya formatının bir dezavantajı vardır. Doküman oluşturulurken kod yazılması gerekmektedir. Bu işlem çoğu kullanıcı için sorun olmaktadır. Resim formatındaki bir dokümandan LaTex kodunun üretilmesi bilgisayarlı görü ve doğal dil işleme alanlarının birlikte kullanılmasını gerektirmektedir. Bu çalışmada öncelikle resim üzerinde metin, tablo ve şekillerin bulunduğu yerlerin sınırları (bloklar) tespit edilmiştir. Sonrasında bulunan bu blokların doğal dil işleme metotları ile metinlerin sınıfları tespit edilmiştir. LaTex kodu oluşturulacak dokümanın akışının bozulmaması için okuma sırası tespit edilmiştir. Son aşama olarak tüm bilgiler kullanılarak LaTex kodu üretilmiştir.

Özet (Çeviri)

Nowadays, digital documents have steadily replacing printed documents. These documents can be in dijital images or in custom file format. Widely used word processing programs appeal to the general audience and their use has been developed to be as a simple to use as possible for the end user. Documents prepared using LaTex file format provide a more professional-level content. The LaTex file format is especially preferred for the writing books and academic documents. This file format, which is preferred by academic circles, has a drawback. Code must be written when creating the document. This process is a problem for most users. Generating LaTex code from an image-formatted document requires both the use of computer vision and natural language processing areas. In this study, the boundaries (blocks) of the places where text, tables and figures are located on the picture were found out. The natural language processing methods and classes of the texts were detected in these blocks afterwards. The reading order has been determined so that the flow of the document to be created in LaTex code is not disrupted. As a final stage, LaTex code is generated using all the information available.

Benzer Tezler

  1. Yapay sinir ağları ile bankacılık dokümanlarının sınıflandırılması

    Classification of banking documents with artificial neural networks

    ALİ ESER

    Yüksek Lisans

    Türkçe

    Türkçe

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolNecmettin Erbakan Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ABDULLAH ERDAL TÜMER

  2. Event extraction from Turkish Trade Registry Gazette

    Türkiye Ticaret Sicili Gazetesi'nden olay çıkarımı

    İREM NUR DEMİRTAŞ

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. GÜLŞEN ERYİĞİT

  3. Esnek resim damgalama: Blok tabanlı damgalama analizi, vektör damgası kullanımı ve doğrulama damgalamasının geliştirilmesi

    Resilient image watermarking: Block-based image watermarking analysis, using vector image as watermark and improving authentication purpose watermarking

    AHMET ŞENOL

    Doktora

    Türkçe

    Türkçe

    2018

    Bilgi ve Belge YönetimiHacettepe Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. HAYRİ SEVER

  4. İlkokul dördüncü sınıf Türkçe dersinde dinleme becerilerinin geliştirilmesinde dijital hikayelerin kullanılması

    The use of digital stories to develop listening skills in the elementary school fourth grade Turkish course

    FATİH MEHMET CİĞERCİ

    Doktora

    Türkçe

    Türkçe

    2015

    Eğitim ve ÖğretimAnadolu Üniversitesi

    İlköğretim Ana Bilim Dalı

    PROF. DR. MEHMET GÜLTEKİN

  5. Interactive parallel video editing using FPGA structures

    FPGA yapıları kullanarak paralel etkileşimli video editleme

    OKAN ÇOBANOĞLU

    Yüksek Lisans

    İngilizce

    İngilizce

    2011

    Elektrik ve Elektronik MühendisliğiDokuz Eylül Üniversitesi

    Elektrik ve Elektronik Mühendisliği Bölümü

    YRD. DOÇ. DR. AHMET ÖZKURT