Resimli doküman görüntülerinde doku özelliğine göre metin alanlarının bulunmasını sağlayan bir sistem
A system to find text areas according to textural features in digital document images
- Tez No: 201384
- Danışmanlar: YRD. DOÇ. DR. M. ELİF KARSLIGİL
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Metin alanlarının çıkarılması, Gabor filtreleme, çok kanallı filtreleme, sayfa plan analizi, karakter takibi, Text area extraction, Gabor filtering, Multi-channel filtering, Page layout analysis, Character tracing
- Yıl: 2007
- Dil: Türkçe
- Üniversite: Yıldız Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 97
Özet
Sayısal ortama aktarılan yazılı ve basılı dokümanlar;, bilgiye erişim, depolama, güncelleme ve en önemlisi de bilgi paylaşımında kolaylık sağlamıştır. Ancak bu sayısal dokümanların düzenlenmesi için sunulan sayfa planını çıkartma, resim ve metin bölgelerini ayırt etme konusunda yapılan çalışmaların artmasına neden olmuştur. Bu çalışmada, yazı karakterlerinden oluşan metin bölgelerindeki dokusal özelliğin, resim bölgelerindeki dokusal özellikten farklı olduğu değerlendirilerek doküman görüntüsü üzerinde metin alanlarını tespit eden bir sistem geliştirilmiştir. Yazı karakterlerinin duyarlı olduğu açı değerlerine göre hazırlanan tek değer oranlı Gabor filtresinin görüntü üzerine uygulanmasıyla yüksek frekanslı bileşenler ve düşük frekanslı bileşenler elde edilmiştir. Yüksek frekanslı bileşenlerin olası yazı karakteri olduğu kabul edilmiş , buna uymayan çizgi, çerçeve v.b. yüksek frekanslı bileşenler, bağlı-parçacıklar yöntemiyle elenmiştir. Mevcut yöntemlerden farklı olarak, kelime ve cümleleri oluşturan karakterlerin devamlılık ve komşuluk özellikleri de değerlendirilerek olası yazı karakterleri üzerinde eleme yapılmıştır. Yazı karakteri, karakter takibi olarak adlandırılan bu eleme yöntemiyle bulunmuştur. Oluşturulan doküman modeli optik karakter tanıma işlemi için hazır hale getirilmiştir. Önerilen yöntem doğrultusunda tasarlanılan sistemin Gabor filtreleme basamağında, tek değer oranlı Gabor filtresi kullanılarak metin alanlarının bulunması hızlandırılmıştır. Yeni bir yaklaşım olarak sunulan karakter takip yöntemiyle yazı karakterlerinin tespitinde sistemin başarı oranı arttırılmıştır. Bu sistemle, karmaşık sayfa planına sahip Latince ve Kirilce gibi farklı alfabelerin harflerinden oluşan değişik dillerdeki dokümanlarda metin alanlarının bulunmasında başarılı sonuçlar elde edilmiştir.
Özet (Çeviri)
Written and printed documents that are transferred to digital platform, provided an easy way for gathering, storing, updating and sharing of information but increased research in page layout analysis and text area extraction. In this work, a system that finds text areas in digital document images, was developed with evaluation of the textural feature difference between image region and text region that is composed of text characters. In document images high frequency and low frequency components were extracted by applying single value proportional Gabor filter that is created due to angle values which text characters are sensitive to. With the idea of high frequency components are probable text characters, some high frequency components such as lines, windows etc. were eliminated by connected-component analysis. Different from existing methods, an elimination named character tracing was done on probable text characters with evaluation of text character?s continuity and neighborhood. Document model were created for optical character recognition process after finding text characters with character tracing method. In the designed system which was developed due to suggested approach, the process of text area extraction was speed up by using of one value rationed Gabor filter in Gabor filtering step. Character tracing method which is a new approach, increased the success rate of system in process of text characters determination. With this system, successful results are obtained in documents which have complex page layouts and text areas which are composed of different alphabet?s characters such as Latin and Cyrillic.
Benzer Tezler
- Resimli çocuk kitaplarındaki toplumsal cinsiyet olgusunun incelenmesi
Investigation of the social gender in picture children's books
YETER TOMRİS SALMAN ERDEN
Yüksek Lisans
Türkçe
2019
Eğitim ve ÖğretimAydın Adnan Menderes ÜniversitesiTemel Eğitim Ana Bilim Dalı
DOÇ. DR. AYŞE ÖZTÜRK SAMUR
- Resimli çocuk kitaplarında aile ortamı ve aile ilişkileri ile annelerin çocuklarıyla kitap okumaya dair görüşlerinin incelenmesi
Investigation of family environment and family relations in pictured children books and the views of mothers about reading books with their children
BÜŞRA GÖKTAŞ
Yüksek Lisans
Türkçe
2022
Eğitim ve ÖğretimAnkara ÜniversitesiÇocuk Gelişimi Ana Bilim Dalı
PROF. DR. GÜLEN BARAN
- Resimli hikâye kitaplarının akıl yürütme becerileri yönünden incelenmesi ve çocukların kitap okuma sürecindeki akıl yürütmeye ilişkin ifadeleri
Examination of picture story books used in pre-school education institutions in terms of reasoning skills and revealing children's expressions of reasonings in book
ZEKİYE AYBÜKE EFE
Yüksek Lisans
Türkçe
2023
Eğitim ve ÖğretimAydın Adnan Menderes ÜniversitesiTemel Eğitim Ana Bilim Dalı
DR. ÖĞR. ÜYESİ NİSA BAŞARA BAYDİLEK
- Resimli çocuk kitaplarının zorbalık olgusu açısından doküman analizi ile incelenmesi
Analysis of illustrated children's books in terms of bullying by document analysis method
REİS BEŞER
Yüksek Lisans
Türkçe
2019
Eğitim ve ÖğretimBursa Uludağ ÜniversitesiTemel Eğitim Ana Bilim Dalı
PROF. DR. HÜLYA KARTAL
- Feridun Oral'ın resimli öykü kitapları üzerine bir doküman incelemesi
A document analysis on Feridun Oral's picture story books'.
ŞENNUR DEMİR
Yüksek Lisans
Türkçe
2019
Eğitim ve ÖğretimHacettepe ÜniversitesiTemel Eğitim Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ÇİĞDEM İŞ GÜZEL