Geri Dön

Segmentation based Ottoman text and matching based kufic image analysis

Bölütleme tabanlı Osmanlıca metin ve eşleştirme tabanlı kufi resim analizi

  1. Tez No: 335641
  2. Yazar: HANDE ADIGUZEL
  3. Danışmanlar: YRD. DOÇ. DR. PINAR DUYGULU ŞAHİN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2013
  8. Dil: İngilizce
  9. Üniversite: İhsan Doğramacı Bilkent Üniversitesi
  10. Enstitü: Mühendislik ve Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Bölümü
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 115

Özet

Tarihsel arşivler dünyanın pek çok yerinden akademisyenlerin ve konuyla ilgilenen araştırmacıların ilgisini çekmektedir. Bu belgelere erişim isteğinin artması otomatik erişim ve tanıma sistemlerini zorunlu kılmaktadır. Osmanlıca belgeler tarihsel belgeler arasında önemli ve büyük bir yer kaplamaktadır. Osmanlıca günümüzde halen konuşulan bir dil olmamasına rağmen bir çok tarihçinin ilgisini çekmektedir. Bu tezde de iki adet Osmanlıca belge analizi çalışması sunulmaktadır. İlki Osmanlıca belgelerin bölütlenmesi olup; bölge, satır ve kelime bölütleme çalışılmıştır. Bölgelere ayırma Log-Gabor filtreleme yöntemi ile sağlanmıştır. Satırlara bölütleme içinse 4 farklı yöntem sunulmaktadır. Son olarak ise belgeler morfolojik yöntemler ile kelimelere ayrılmıştır. Veri kümelerine Osmanlıca?nın yanında farklı dillerden oluşan belgeler (İngilizce, Yunanca ve Bangla) da eklenmiştir. Deneylerden elde edilen sonuçlar bölütleme algoritmalarının iyi çalıştığını göstermektedir. Tezin ikinci kısmında ise Kufi resimlerinde İslami motiflerin tespiti amaçlanmıştır. Motiflerin temsili için grafikler kullanılmıştır. Eşyapılı grafikler ve altçizgeler incelenerek motifler eşleştirilmeye çalışılmıştır. Kufi imgeleri farklı deneyler ile incelenmiştir. İlki verilen bir sorgu motifinin veri kümesinden geri getirilmesidir. İkinci deney Kufi resimlerinin otomatik etiketlenmesidir. Son olarak, her resimdeki tekrarlanan motifler incelenmiştir. İnternet üzerinden toplanan resimlerle bir veri kümesi oluşturulmuştur. önerilen yöntem bu veri kümesi ile test edilmiş ve umut verici sonuçlar elde edilmiştir.

Özet (Çeviri)

Large archives of historical documents attract many researchers from all around the world. The increasing demand to access those archives makes automatic retrieval and recognition of historical documents crucial. Ottoman archives are one of the largest collections of historical documents. Although Ottoman is not a currently spoken language, many researchers from all around the world are interested in accessing the archived material. This thesis proposes two Ottoman document analysis studies; first one is a crucial pre-processing task for retrieval and recognition which is segmentation of documents. Second one is a more specific retrieval and recognition problem which aims matching Islamic patterns is Kufic images. For the first segmentation task, layout, line and word segmentation is studied. Layout segmentation is obtained via Log-Gabor filtering. Four different algorithms are proposed for line segmentation and finally a simple morphological method is preferred for word segmentation. Datasets are constructed with documents from both Ottoman and other languages (English, Greek and Bangla) to test the script-independency of the methods. Experiments show that our segmentation steps give satisfactory results. The second task aims to detect Islamic patterns in Kufic images. The sub-patterns are considered as basic units and matching is used for the analysis. Graphs are preferred to represent sub-patterns where graph and sub-graph isomorphism are used for matching them. Kufic images are analyzed in three different ways. Given a query pattern, all the instances of the query can be found through retrieval. Going further, through known patterns images can be automatically labeled in the entire dataset. Finally, patterns that repeat inside an image can be automatically discovered. As there is no existing Kufic dataset, a new one is constructed by collecting images from the Internet and promising results are obtained on this dataset.

Benzer Tezler

  1. Osmanlıcadan modern Türkçeye uçtan uca aktarım sistemi

    End-to-end conversion system from Ottoman to modern Turkish

    İSHAK DÖLEK

    Doktora

    Türkçe

    Türkçe

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Üniversitesi-Cerrahpaşa

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ATAKAN KURT

  2. An Ottoman character recognizer

    Başlık çevirisi yok

    MUSTAFA ÖZÇİLİNGİR

    Yüksek Lisans

    İngilizce

    İngilizce

    1990

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. NEŞE YALABIK

  3. Segmentation, feature extraction and recognition of ottoman script

    Osmanlıca metinin bölütlenmesi, öznitelik çıkarımı ve tanınması

    ALPER ATICI

    Yüksek Lisans

    İngilizce

    İngilizce

    1994

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. FATOŞ YARMAN VURAL

  4. Historical document analysis based on word matching

    Kelime eşleştirme tabanlı tarihsel belge analizi

    DAMLA ARİFOĞLU

    Yüksek Lisans

    İngilizce

    İngilizce

    2011

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİhsan Doğramacı Bilkent Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. PINAR DUYGULU

  5. Nüfus sayımlarına göre Ilgın kazası (1830-1844)

    According to the population census in 1830-1844, district Ilgın

    CANAN SARIYAR

    Yüksek Lisans

    Türkçe

    Türkçe

    2015

    TarihSelçuk Üniversitesi

    Tarih Ana Bilim Dalı

    DOÇ. DR. HÜSEYİN MUŞMAL