Fotoğraftan bağlam bazlı geometri uyumlu doküman oluşturma

Context driven geometry consistent document reconstruction from photograph

PDF İndir

Tez No: 649851
Yazar: YUSUF COŞKUNER
Danışmanlar: DR. ÖĞR. ÜYESİ YAKUP GENÇ
Tez Türü: Yüksek Lisans
Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
Anahtar Kelimeler: Makine Öğrenmesi, Bilgisayarla Görme, Konvolüsyonel Sinir Ağları, Segmentasyon, Doküman Oluşturma, Machine Learning, Computer Vision, Convolutional Neural Network, Segmentation, Document Reconstruction
Yıl: 2020
Dil: Türkçe
Üniversite: Gebze Teknik Üniversitesi
Enstitü: Fen Bilimleri Enstitüsü
Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
Bilim Dalı: Belirtilmemiş.
Sayfa Sayısı: 67

Özet

Kağıt dokümanlar bazı alanlarda halen vazgeçilmez olsa da, dokümanları dijital ortama aktarıp saklamak kişi ve kurumlara bazı avantajlar sağlamaktadır. Tarayıcılar bu amaçla sıkça kullanılan araçlardır ve kaliteli belge görüntüleri sağlarlar. Fakat her ihtiyaç anında bir tarayıcı bulunamaz. Günümüzde kaliteli kamera barındıran mobil cihazlar da dokümanları dijital ortama aktarmak için sıkça kullanılmaktadırlar. Bu cihazlarla dokümanları fotoğraflamak çok pratik olsa da, kaliteli doküman görüntüsü elde etmek zordur. Perspektif, aydınlatma problemleri yada dokümanın uygun olmayan fiziksel durumu gibi nedenlerle ideal doküman görüntüsü oluşturulamaz. Geometrik bozulmaların düzeltilmesi, fotoğraflanan dokümanın 3B yapısının tahminini gerektirir. Çalışmada sinir ağlarını kullanarak dokümanın 3B şeklinin tahminini yapan yeni bir yaklaşım sunulmuştur. 3B tahmin, fotoğraf üzerinde geometrik bilgilere sahip olmayı gerektirir. Modellenen sinir ağları görüntünün bağlamından geometrik bilgiler çıkararak 3B şeklin yapılandırılmasını sağlamaktadır. Böylece ideal doküman geometrisine ulaşılır. Diğer problem, aydınlatma koşullarına bağlı olarak dokümanın düzensiz tonlamalarla görüntülenmesidir. Düzensiz tonlamaların giderilip metin ve arka-planın ayrıştırılması için segmentasyon gereklidir. Bu maçla ilk olarak bir“yerel uyarlamalı eşikleme algoritması”uygulanmıştır. İkinci olarak ise, popüler bir sinir ağı olan SegNet modelini temel alan bir bölütleme algoritması gerçekleştirilmiştir. Sinir ağlarının eğitiminde gerçekte karşılaşılan fotoğraflama koşullarını yansıtan veriler kullanılmıştır. Bundan dolayı yöntem çok çeşitli koşullar altında elde edilmiş fotoğraflara uygulanabilmektedir. Uygulamanın başarısını ölçmek için yapılan deneyler ve bir ticari uygulama ile yapılan karşılaştırma yöntemin başarılı çalıştığını göstermiştir.

Özet (Çeviri)

Although paper documents are still indispensable in some areas, transferring and storing documents provide advantages to users. Scanners are frequently used devices for this purpose and provide quality document images. However, we don't have a chance to find a scanner whenever we need it. Nowadays, mobile devices with quality cameras are also frequently used to digitize documents. Although photographing documents with these devices is very practical, it is difficult to obtain a quality document image. The quality document image cannot be created due to perspective or lighting problems. The rectification of geometric distortions requires an estimation of the 3D shape of the photographed document. In this study, a new approach that predicts the 3D shape using neural networks is introduced. Estimating the 3D shape requires having geometric information on the photo. Modeled networks extract geometric information from the context of the document image and 3D shape is created. Besides, the documents are photographed in undesirable tones, depending on the lighting conditions. Segmentation is required to separate text and background. To this purpose, an adaptive thresholding algorithm and an algorithm based on the SegNet model was applied separately. Data reflecting actual document conditions were used to train the neural networks. Therefore, the method can be applied to images that are photographed from varying perspectives and creased in many different ways. Experiments to measure the success of the studies and comparison with a commercial application shows that the method works well.

Benzer Tezler

Tez No
100873
Digital topografik haritalar ile digital ortofoto haritaların doğruluk, maliyet ve üretim zamanı açısından karşılaştırılması
Comparison of digital orthophoto maps with digital topographic maps
OKTAY EKER
Yüksek Lisans
Türkçe
2000
Jeodezi ve Fotogrametri İstanbul Teknik Üniversitesi
DOÇ.DR. DURSUN Z. ŞEKER
Tez No
808924
Mimari tasarımda hareket ve zamana bağlı algoritmik modelleme: Tabiat fenomenleri etkisinde matematiksel eğriler
Motion and time base algorithmic modelling in architectural design: Mathematical curves in the effect of natural phenomenons
ÖZGÜR KAVURMACIOĞLU
Doktora
Türkçe
2023
Mimarlık Beykent Üniversitesi
Mimarlık Ana Bilim Dalı
PROF. DR. SERCAN ÖZGENCİL YILDIRIM
Tez No
559889
Photogrammetry based heritage modeling with shape embedding
Tarihi yapıların fotogrametri ve gömülü biçimlerle modellenmesi
DEMİRCAN TAŞ
Yüksek Lisans
İngilizce
2019
Mimarlık İstanbul Teknik Üniversitesi
Bilişim Ana Bilim Dalı
PROF. DR. MİNE ÖZKAR KABAKÇIOĞLU
Tez No
800343
Palimpsest olgusu ve fotoğrafta katman
Concept of palimpsest and layers in photography
DAMLA YASEMİN URAZ
Yüksek Lisans
Türkçe
2023
Sahne ve Görüntü Sanatları Dokuz Eylül Üniversitesi
Fotoğraf Ana Sanat Dalı
DOÇ. DR. GÖKHAN BİRİNCİ
Tez No
6364
Fotoğraf ve gerçeklik
Photography and reality
İHSAN DERMAN
Doktora
Türkçe
1988
Sahne ve Görüntü Sanatları Anadolu Üniversitesi

Geri Dön