Geri Dön

Resimli doküman görüntülerinde doku özelliğine göre metin alanlarının bulunmasını sağlayan bir sistem

A system to find text areas according to textural features in digital document images

  1. Tez No: 201384
  2. Yazar: İLKTAN AR
  3. Danışmanlar: YRD. DOÇ. DR. M. ELİF KARSLIGİL
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Metin alanlarının çıkarılması, Gabor filtreleme, çok kanallı filtreleme, sayfa plan analizi, karakter takibi, Text area extraction, Gabor filtering, Multi-channel filtering, Page layout analysis, Character tracing
  7. Yıl: 2007
  8. Dil: Türkçe
  9. Üniversite: Yıldız Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 97

Özet

Sayısal ortama aktarılan yazılı ve basılı dokümanlar;, bilgiye erişim, depolama, güncelleme ve en önemlisi de bilgi paylaşımında kolaylık sağlamıştır. Ancak bu sayısal dokümanların düzenlenmesi için sunulan sayfa planını çıkartma, resim ve metin bölgelerini ayırt etme konusunda yapılan çalışmaların artmasına neden olmuştur. Bu çalışmada, yazı karakterlerinden oluşan metin bölgelerindeki dokusal özelliğin, resim bölgelerindeki dokusal özellikten farklı olduğu değerlendirilerek doküman görüntüsü üzerinde metin alanlarını tespit eden bir sistem geliştirilmiştir. Yazı karakterlerinin duyarlı olduğu açı değerlerine göre hazırlanan tek değer oranlı Gabor filtresinin görüntü üzerine uygulanmasıyla yüksek frekanslı bileşenler ve düşük frekanslı bileşenler elde edilmiştir. Yüksek frekanslı bileşenlerin olası yazı karakteri olduğu kabul edilmiş , buna uymayan çizgi, çerçeve v.b. yüksek frekanslı bileşenler, bağlı-parçacıklar yöntemiyle elenmiştir. Mevcut yöntemlerden farklı olarak, kelime ve cümleleri oluşturan karakterlerin devamlılık ve komşuluk özellikleri de değerlendirilerek olası yazı karakterleri üzerinde eleme yapılmıştır. Yazı karakteri, karakter takibi olarak adlandırılan bu eleme yöntemiyle bulunmuştur. Oluşturulan doküman modeli optik karakter tanıma işlemi için hazır hale getirilmiştir. Önerilen yöntem doğrultusunda tasarlanılan sistemin Gabor filtreleme basamağında, tek değer oranlı Gabor filtresi kullanılarak metin alanlarının bulunması hızlandırılmıştır. Yeni bir yaklaşım olarak sunulan karakter takip yöntemiyle yazı karakterlerinin tespitinde sistemin başarı oranı arttırılmıştır. Bu sistemle, karmaşık sayfa planına sahip Latince ve Kirilce gibi farklı alfabelerin harflerinden oluşan değişik dillerdeki dokümanlarda metin alanlarının bulunmasında başarılı sonuçlar elde edilmiştir.

Özet (Çeviri)

Written and printed documents that are transferred to digital platform, provided an easy way for gathering, storing, updating and sharing of information but increased research in page layout analysis and text area extraction. In this work, a system that finds text areas in digital document images, was developed with evaluation of the textural feature difference between image region and text region that is composed of text characters. In document images high frequency and low frequency components were extracted by applying single value proportional Gabor filter that is created due to angle values which text characters are sensitive to. With the idea of high frequency components are probable text characters, some high frequency components such as lines, windows etc. were eliminated by connected-component analysis. Different from existing methods, an elimination named character tracing was done on probable text characters with evaluation of text character?s continuity and neighborhood. Document model were created for optical character recognition process after finding text characters with character tracing method. In the designed system which was developed due to suggested approach, the process of text area extraction was speed up by using of one value rationed Gabor filter in Gabor filtering step. Character tracing method which is a new approach, increased the success rate of system in process of text characters determination. With this system, successful results are obtained in documents which have complex page layouts and text areas which are composed of different alphabet?s characters such as Latin and Cyrillic.

Benzer Tezler

  1. Resimli çocuk kitaplarındaki toplumsal cinsiyet olgusunun incelenmesi

    Investigation of the social gender in picture children's books

    YETER TOMRİS SALMAN ERDEN

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    Eğitim ve ÖğretimAydın Adnan Menderes Üniversitesi

    Temel Eğitim Ana Bilim Dalı

    DOÇ. DR. AYŞE ÖZTÜRK SAMUR

  2. Resimli çocuk kitaplarında aile ortamı ve aile ilişkileri ile annelerin çocuklarıyla kitap okumaya dair görüşlerinin incelenmesi

    Investigation of family environment and family relations in pictured children books and the views of mothers about reading books with their children

    BÜŞRA GÖKTAŞ

    Yüksek Lisans

    Türkçe

    Türkçe

    2022

    Eğitim ve ÖğretimAnkara Üniversitesi

    Çocuk Gelişimi Ana Bilim Dalı

    PROF. DR. GÜLEN BARAN

  3. Resimli hikâye kitaplarının akıl yürütme becerileri yönünden incelenmesi ve çocukların kitap okuma sürecindeki akıl yürütmeye ilişkin ifadeleri

    Examination of picture story books used in pre-school education institutions in terms of reasoning skills and revealing children's expressions of reasonings in book

    ZEKİYE AYBÜKE EFE

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    Eğitim ve ÖğretimAydın Adnan Menderes Üniversitesi

    Temel Eğitim Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ NİSA BAŞARA BAYDİLEK

  4. Resimli çocuk kitaplarının zorbalık olgusu açısından doküman analizi ile incelenmesi

    Analysis of illustrated children's books in terms of bullying by document analysis method

    REİS BEŞER

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    Eğitim ve ÖğretimBursa Uludağ Üniversitesi

    Temel Eğitim Ana Bilim Dalı

    PROF. DR. HÜLYA KARTAL

  5. Feridun Oral'ın resimli öykü kitapları üzerine bir doküman incelemesi

    A document analysis on Feridun Oral's picture story books'.

    ŞENNUR DEMİR

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    Eğitim ve ÖğretimHacettepe Üniversitesi

    Temel Eğitim Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ÇİĞDEM İŞ GÜZEL