Geri Dön

Fotoğraftan bağlam bazlı geometri uyumlu doküman oluşturma

Context driven geometry consistent document reconstruction from photograph

  1. Tez No: 649851
  2. Yazar: YUSUF COŞKUNER
  3. Danışmanlar: DR. ÖĞR. ÜYESİ YAKUP GENÇ
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Makine Öğrenmesi, Bilgisayarla Görme, Konvolüsyonel Sinir Ağları, Segmentasyon, Doküman Oluşturma, Machine Learning, Computer Vision, Convolutional Neural Network, Segmentation, Document Reconstruction
  7. Yıl: 2020
  8. Dil: Türkçe
  9. Üniversite: Gebze Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 67

Özet

Kağıt dokümanlar bazı alanlarda halen vazgeçilmez olsa da, dokümanları dijital ortama aktarıp saklamak kişi ve kurumlara bazı avantajlar sağlamaktadır. Tarayıcılar bu amaçla sıkça kullanılan araçlardır ve kaliteli belge görüntüleri sağlarlar. Fakat her ihtiyaç anında bir tarayıcı bulunamaz. Günümüzde kaliteli kamera barındıran mobil cihazlar da dokümanları dijital ortama aktarmak için sıkça kullanılmaktadırlar. Bu cihazlarla dokümanları fotoğraflamak çok pratik olsa da, kaliteli doküman görüntüsü elde etmek zordur. Perspektif, aydınlatma problemleri yada dokümanın uygun olmayan fiziksel durumu gibi nedenlerle ideal doküman görüntüsü oluşturulamaz. Geometrik bozulmaların düzeltilmesi, fotoğraflanan dokümanın 3B yapısının tahminini gerektirir. Çalışmada sinir ağlarını kullanarak dokümanın 3B şeklinin tahminini yapan yeni bir yaklaşım sunulmuştur. 3B tahmin, fotoğraf üzerinde geometrik bilgilere sahip olmayı gerektirir. Modellenen sinir ağları görüntünün bağlamından geometrik bilgiler çıkararak 3B şeklin yapılandırılmasını sağlamaktadır. Böylece ideal doküman geometrisine ulaşılır. Diğer problem, aydınlatma koşullarına bağlı olarak dokümanın düzensiz tonlamalarla görüntülenmesidir. Düzensiz tonlamaların giderilip metin ve arka-planın ayrıştırılması için segmentasyon gereklidir. Bu maçla ilk olarak bir“yerel uyarlamalı eşikleme algoritması”uygulanmıştır. İkinci olarak ise, popüler bir sinir ağı olan SegNet modelini temel alan bir bölütleme algoritması gerçekleştirilmiştir. Sinir ağlarının eğitiminde gerçekte karşılaşılan fotoğraflama koşullarını yansıtan veriler kullanılmıştır. Bundan dolayı yöntem çok çeşitli koşullar altında elde edilmiş fotoğraflara uygulanabilmektedir. Uygulamanın başarısını ölçmek için yapılan deneyler ve bir ticari uygulama ile yapılan karşılaştırma yöntemin başarılı çalıştığını göstermiştir.

Özet (Çeviri)

Although paper documents are still indispensable in some areas, transferring and storing documents provide advantages to users. Scanners are frequently used devices for this purpose and provide quality document images. However, we don't have a chance to find a scanner whenever we need it. Nowadays, mobile devices with quality cameras are also frequently used to digitize documents. Although photographing documents with these devices is very practical, it is difficult to obtain a quality document image. The quality document image cannot be created due to perspective or lighting problems. The rectification of geometric distortions requires an estimation of the 3D shape of the photographed document. In this study, a new approach that predicts the 3D shape using neural networks is introduced. Estimating the 3D shape requires having geometric information on the photo. Modeled networks extract geometric information from the context of the document image and 3D shape is created. Besides, the documents are photographed in undesirable tones, depending on the lighting conditions. Segmentation is required to separate text and background. To this purpose, an adaptive thresholding algorithm and an algorithm based on the SegNet model was applied separately. Data reflecting actual document conditions were used to train the neural networks. Therefore, the method can be applied to images that are photographed from varying perspectives and creased in many different ways. Experiments to measure the success of the studies and comparison with a commercial application shows that the method works well.

Benzer Tezler

  1. Digital topografik haritalar ile digital ortofoto haritaların doğruluk, maliyet ve üretim zamanı açısından karşılaştırılması

    Comparison of digital orthophoto maps with digital topographic maps

    OKTAY EKER

    Yüksek Lisans

    Türkçe

    Türkçe

    2000

    Jeodezi ve Fotogrametriİstanbul Teknik Üniversitesi

    DOÇ.DR. DURSUN Z. ŞEKER

  2. Mimari tasarımda hareket ve zamana bağlı algoritmik modelleme: Tabiat fenomenleri etkisinde matematiksel eğriler

    Motion and time base algorithmic modelling in architectural design: Mathematical curves in the effect of natural phenomenons

    ÖZGÜR KAVURMACIOĞLU

    Doktora

    Türkçe

    Türkçe

    2023

    MimarlıkBeykent Üniversitesi

    Mimarlık Ana Bilim Dalı

    PROF. DR. SERCAN ÖZGENCİL YILDIRIM

  3. Photogrammetry based heritage modeling with shape embedding

    Tarihi yapıların fotogrametri ve gömülü biçimlerle modellenmesi

    DEMİRCAN TAŞ

    Yüksek Lisans

    İngilizce

    İngilizce

    2019

    Mimarlıkİstanbul Teknik Üniversitesi

    Bilişim Ana Bilim Dalı

    PROF. DR. MİNE ÖZKAR KABAKÇIOĞLU

  4. Palimpsest olgusu ve fotoğrafta katman

    Concept of palimpsest and layers in photography

    DAMLA YASEMİN URAZ

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    Güzel SanatlarDokuz Eylül Üniversitesi

    Fotoğraf Ana Sanat Dalı

    DOÇ. DR. GÖKHAN BİRİNCİ

  5. Fotoğraf ve gerçeklik

    Photography and reality

    İHSAN DERMAN