Geri Dön

An integrated architecture for information extraction from documents in Turkish

Türkçe belgelerden bilgi çıkarımı için tümleşik bir mimari

  1. Tez No: 293696
  2. Yazar: ŞERİF ADALI
  3. Danışmanlar: PROF. DR. A. COŞKUN SÖNMEZ
  4. Tez Türü: Doktora
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2009
  8. Dil: İngilizce
  9. Üniversite: İstanbul Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 131

Özet

Bu çalısmada bir belge alanına ait eylemler ve iliskili bilgilerin çıkarılması için ontolojitabanlı bilgi çıkarımı teknikleri ile belge yapı analizi teknikleri bir arada kullanılmıstır.Önerilen ?Kavram Bölme? tekniği sayesinde çıkarım eylemleri kolaylıklatanımlanmakta ve çıkarım sisteminin yeni bir alana tasınması hızlandırılmakta, ayrıcametin sablonları kullanmaya gerek kalmadan çok küçük bir bilgi tabanı ile basarılısekilde çıkarımlar yapılabilmektedir. Önerilen mimarinin kısıtlı belge alanı veuygulamalarında yüksek basarı sağladığı görülmüstür. Ayrıca yaklasım tablolu, listelive maddesellestirilmis yapıdaki metinlerden veri çıkarımı konusunda yüksek basarısağlamıstır. Çıkarım ontolojisi kullanılarak yaklasım, bilinmeyen bir eyleme en yakıneylemi bulmak için kural tabanında tanımlı olan kavramlar ile metinde yer alankavramlar arasındaki benzerliği hesaplamakta ve bu bilgiye dayalı olarak kullanıcısisteme kademeli sekilde yeni çıkarım kavramlarını, anahtar kavram birimlerini vekavram özelliklerini eklemektedir. Yaklasım aynı zamanda yeni kesfedilmis verileriontolojiye örnekleri olarak ekleyerek ontolojiyi zenginlestirmektedir. Deneysel sonuçlarayrıca yüksek basarımlı belge isleme için yeterli sayıda sözlüksel kaynağa, çıkarımkavramına ve belge yapı tanımlamasına ihtiyaç duyulduğunu göstermektedir. Ayrıcabelge yapı analizi bilinmeyen varlık tiplerinin çıkarımında kullanılmakla birlikte,eylemlerle iliskilendirilmis anahtar değerler kullanılarak çıkarımı yapımıs bilgiler ve bubilgiler arasındaki iliskiler kontrol edilmektedir.

Özet (Çeviri)

In this study, ontology based information extraction and document layout analysistechniques are integrated for extracting domain specific events and entities. Proposed?Concept Zoning? technique provides easy definition of extraction concepts andincreases portability of the IE system and requires only concept definitions whencompared to approaches that rely on large sets of linguistic patterns. Proposedarchitecture works well when applied to restricted domain applications. It alsosuccessfuly detects data in tabular, list or itimized form. In case of an unknown event,concept similarity is calculated by comparing the concepts in the input document againstthe concepts in the ontology and new attributes, key concept nodes and conceptsproperties are incrementally added to the knowledge base by the user. Domain ontologyis enriched by adding newly discovered instances. Experimental results indicate that ahigh performance document processing system has to cover enough number of lexicalresources, extraction concepts and document models. In addition, document layoutanalysis is used for detecting unknown entity types and approach verifies extractedinformation and relations among them by using key values defined for each domainevent.

Benzer Tezler

  1. Sürdürülebilir çevre için mimari aydınlatma sistemi tasarımında kullanılabilecek bir yaklaşım

    An architectural lighting system design approach for sustainable environments

    FERİDE ŞENER YILMAZ

    Doktora

    Türkçe

    Türkçe

    2014

    Mimarlıkİstanbul Teknik Üniversitesi

    Mimarlık Ana Bilim Dalı

    PROF. DR. ALPİN KÖKNEL YENER

  2. Web 3.0 teknolojileri i̇le sosyal medya veri anlamlandirmasina yönelik bir model geliştirme

    Developing a model for social media data semantics with web 3.0 technologies

    VALA GASHI ADIGÜZELLİ

    Doktora

    Türkçe

    Türkçe

    2024

    Bilgi ve Belge Yönetimiİstanbul Üniversitesi

    Fen Bilimleri Ana Bilim Dalı

    PROF. DR. SEVİNÇ GÜLSEÇEN

  3. Yaşam dünyası bağlamında geleneksel konut yerleşmelerinin sürdürülebilirliği ve Kastamonu örneği

    Sustainability of housing settlements within the context of life-world and Kastamonu example

    NURDEREN ÖZBEK

    Doktora

    Türkçe

    Türkçe

    2018

    Mimarlıkİstanbul Teknik Üniversitesi

    Mimarlık Ana Bilim Dalı

    PROF. DR. BELKIS ULUOĞLU

  4. Design and implementation of a novel visual analysis system for image classification

    Görüntü sınıflandırma için yeni bir görsel analiz sistem tasarım ve uygulaması

    ÜMİT LÜTFÜ ALTINTAKAN

    Doktora

    İngilizce

    İngilizce

    2013

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. ADNAN YAZICI

  5. Manipulation of visually recognized objects using deep learning

    Görsel tanınan nesnelerin derin öğrenme kullanarak hareket ettirilmesi

    ERTUĞRUL BAYRAKTAR

    Doktora

    İngilizce

    İngilizce

    2018

    Mekatronik Mühendisliğiİstanbul Teknik Üniversitesi

    Mekatronik Mühendisliği Ana Bilim Dalı

    DOÇ. DR. PINAR BOYRAZ