Integrated segmentation and recognition of connected Ottoman script
Bitişik Osmanlıca yazı için tümleşik bölütleme ve tanıma
- Tez No: 177174
- Danışmanlar: PROF. DR. ÖZGÜR ULUSOY, DOÇ. DR. UĞUR GÜDÜKBAY
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2008
- Dil: İngilizce
- Üniversite: İhsan Doğramacı Bilkent Üniversitesi
- Enstitü: Mühendislik ve Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 64
Özet
Bu tez çalışmasında, Osmanlıca bitişik metinlerdeki bağlı karakterler için içeriğe dayalı tümleşik bir bölütleme ve tanıma yöntemi önerilmiştir. Bu yöntem, öncelikle dökümanlardaki bağlı bileşenlerden sistematik olarak bir takım olası parçalar çıkartır ve bu parçalara en çok benzeyen aday karakterleri belirler. Sonrasında ise belirlenen çok sayıdaki aday karakterlerin arasından sözdizim olarak en olası olanlarını seçmek için bir skor fonksiyonu tanımlanmıştır. Bu skor fonksiyonunu maksimize eden karakterler, döngüsüz bir çizge oluşturulup bu çizge üzerindeki en uzun yolu hesaplayarak bulunmaktadır. Deney sonuçları göstermektedir ki, önerilen yöntem yüksek duyarlık ve tanıma oranları sağlamaktadır. Yapılan bilgi erişim deneyleri ise, önerilen yöntemin Osmanlıca matbaa metinler için tasarlanmış bir bilgi erişim sisteminin bir parçası olarak kullanılabileceğini göstermektedir.
Özet (Çeviri)
In this thesis, a novel context-sensitive segmentation and recognition method for connected letters in Ottoman script is proposed. This method first extracts a set of possible segments from a connected script and determines the candidate letters to which extracted segments are most similar. Next, a function is defined for scoring each different syntactically correct sequence of these candidate letters. To find the candidate letter sequence that maximizes the score function, a directed acyclic graph is constructed. The letters are finally recognized by computing the longest path in this graph. Experiments using a collection of printed Ottoman documents reveal that the proposed method provides very high precision and recall figures in terms of character recognition. In a further set of experiments we also demonstrate that the framework can be used as a building block for an information retrieval system for digital Ottoman archives.
Benzer Tezler
- Multimedia data modeling and semantic analysis by multimodal decision fusion
Çoklu karar füzyonu ile medya veri modelleme ve anlamsal bölümleme
MENNAN GÜDER
Doktora
İngilizce
2015
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. FEHİME NİHAN ÇİÇEKLİ
- Lifelong learning for auditory scene analysis
İşitsel sahne analizi için hayat boyu öğrenme
BARIŞ BAYRAM
Doktora
İngilizce
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. GÖKHAN İNCE
- Automatic speech recognition in consecutive interpreter workstation: Computer-aided interpreting tool 'Sight-Terp'
Otomatik konuşma tanıma sistemlerinin ardıl çeviride kullanılması: Sight-Terp
CİHAN ÜNLÜ
Yüksek Lisans
İngilizce
2023
Mütercim-TercümanlıkHacettepe ÜniversitesiMütercim Tercümanlık Ana Bilim Dalı
PROF. DR. AYMİL DOĞAN
- Manipulation of visually recognized objects using deep learning
Görsel tanınan nesnelerin derin öğrenme kullanarak hareket ettirilmesi
ERTUĞRUL BAYRAKTAR
Doktora
İngilizce
2018
Mekatronik Mühendisliğiİstanbul Teknik ÜniversitesiMekatronik Mühendisliği Ana Bilim Dalı
DOÇ. DR. PINAR BOYRAZ
- Integrating near and long-range evidence for visual detection
Görsel tanıma problemlerine yakın ve uzun mesafeli kanıtların entegre edilmesi
NERMİN SAMET
Doktora
İngilizce
2021
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ EMRE AKBAŞ