Geri Dön

Enhancing content management systems with semantic capabilities

Doküman yönetim sistemlerini anlamsal yeteneklerle geliştirme

  1. Tez No: 318814
  2. Yazar: SUAT GÖNÜL
  3. Danışmanlar: PROF. DR. ASUMAN DOĞAÇ, PROF. DR. NİHAN KESİM ÇİÇEKLİ
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgi ve Belge Yönetimi, Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Bilim ve Teknoloji, Information and Records Management, Computer Engineering and Computer Science and Control, Science and Technology
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2012
  8. Dil: İngilizce
  9. Üniversite: Orta Doğu Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 92

Özet

Döküman yönetim sistemleri içeriği genel olarak birçok veritabanı tablosuna dağıtılmış olarak veya dosyalarda bir bütün olarak, herhangi bir ayırt edici özellikleri olmadan saklarlar. Bu depolama mekanizmaları içerikle ilgili anlamsal bilginin yönetilmesini ve böylece depolanmış dökümanların üzerinde anlamsal bilgi çekme, arama gibi işlevleri sağlayamazlar. Anlamsal açıdan yetersiz döküman yönetim sistemlerine gelişmiş anlamsal kabiliyetler kazandırmak için bu sistemlerde depolanan içeriğe ek olarak, sistemin içindeki üstü kapalı anlamsal bilginin ortaya çıkarılması ve zaten var olan içeriğin harici kaynaklardan toplanan, asıl içeriğin kendisiyle alakalı ek bilgilerin dikkate alınması gerekir. Ancak, hali hazırda var olan döküman yönetim sistemlerinden açıkça ifade edilmeyen bilgiyi çıkarmak, bu bilgiyi bir anlamsal döküman yönetim sistemi ortamına aktarmak ve içeriğin üzerinde anlamsal operasyonlar sağlamak; bilgi çıkarma, bilgi çekme ve anlamsal ağ alanlarından bir çok yeniliklerin benimsenmesini gerektiren zorlu bir iştir. Bu çalısmada, içeriğin var olan sistemlerden otomatik olarak çekilmesini, çekilen içeriğin acık bağlantılı veri üzerinden çekilen bilgilerle zenginleştirilmesini; ve depolama ve arama bakımınından birçok anlamsal işlevsellik sağlayan metodolojiler geliştirilmektedir. Önerilen yaklaşımda isteğe uyarlanmış, anlamsal indeks oluşturmak için basit bir RDF yol dili kullanılmaktadır. Bu dil aynı zamanda açık bağlantılı veri üzerinden elde edilen ek bilgilerin özel amaçlı kullanım durumlarına göre filtrelenmesi için de kullanılmaktadır. Filtrelenmiş ek bilgiler dökümanların asıl içerikleriyle beraber özel kullanım için hazırlanmış indekslerde somutlaştırılır. Bu anlamsal indeks alt yapısı anlamsal olarak değeri olan arama işlevlerinin sağlanmasına olanak verir. Önerilen metodoloji IKS projesinin yazilim ürünlerinden biri olan Apache Stanbol projesi kapsamında hayata geçirilmektedir. Bu esnada Apache Stanbol'un depolama ve arama kısımlarına ağırlık verilmektedir. Çalışmanın son aşamasında önerilen metodoloji sağlık alanında çeşitli sağlık portallarından alınan dökümanlarla değerlendirilmektedir. Bu işlem sırasında bağlantılı veri bulutunun bir parçası olan DBPedia ve sağlıkla ilgili üç ontoloji kullanılmaktadır. Bunlar sırasıyla SNOMED/CT, ART ve RXNORM'dur ve bu üç ontoloji dökümanlara sağlıkla ilgili ek bilgi iliştirmek için kullanılmaktadır.

Özet (Çeviri)

Content Management Systems (CMS) generally store data in a way that the content is distributed among several relational database tables or stored in files as a whole without any distinctive characteristics. These storage mechanisms cannot provide the management of semantic information about the data. They lack semantic retrieval, search and browsing of the stored content. To enhance non-semantic CMSes with advanced semantic features, the semantics within the CMS itself and additional semantic information related with the actual managed content should also be taken into account. However, extracting implicit knowledge from the legacy CMSes, lifting to a semantic content management system environment and providing semantic operations on the content is a challenging task which includes adoption of several latest advancements in information extraction (IE), information retrieval (IR) and Semantic Web areas. In this study, we propose an integrative approach including automatic lifting of content from legacy systems, automatic annotation of data with the information retrieved from the Linked Open Data (LOD) cloud and several semantic operations on the content in terms of storage and search. We use a simple RDF path language to create custom, semantic indexes and filter annotations obtained from LOD cloud in a way that is eligible for specific use cases. Filtered annotations are materialized along with the actual content of document in dedicated indexes. This semantix indexing infrastructure allows semantically meaningful search facilities on top of it. We realize our approach in the scope of Apache Stanbol project, which is a subproject developed in the scope of IKS project, by focusing on document storage and retrival parts of it. We evaluate our approach in healthcare domain with different domain ontologies (SNOMED/CT, ART, RXNORM) in addition to DBpedia as parts of LOD cloud which are used annotate documents and content obtained from different health portals.

Benzer Tezler

  1. Semantic enrichment of content management systems: An application on Joomla! CMS

    İçerik yönetim sistemlerinin semantik özelliklerle zenginleştirilmesi: Joomla! içerik yönetim sistemi üzerinde bir uygulama

    UMUTCAN ŞİMŞEK

    Yüksek Lisans

    İngilizce

    İngilizce

    2015

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolEge Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. RIZA CENK ERDUR

  2. ФОРМУВАННЯ ЛІДЕРСЬКОЇ КОМПЕТЕНТНОСТІ В МАЙБУТНІХ КЕРІВНИКІВ-ЖІНОК ЗАГАЛЬНООСВІТНІХ ЗАКЛАДІВ ТУРЕЧЧИНИ

    Türkiye'de genel eğitim kurumlarında gelecekteki kadın yöneticilerinde liderlik yetkinliğinin oluşturulması

    AHMET YILDIRIM

    Doktora

    Ukraynaca

    Ukraynaca

    2021

    Eğitim ve ÖğretimCherkasy National University

    Eğitim Bilimleri Ana Bilim Dalı

    PROF. DR. TYMOFİİ DESİATOV

  3. Dijital dönüşümün kalite yönetim sistemlerine etkisi

    The effect of digital transformation on quality management systems

    AYSEL GULUZADE

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    İşletmeDokuz Eylül Üniversitesi

    Toplam Kalite Yönetimi Ana Bilim Dalı

    PROF. DR. OSMAN AVŞAR KURGUN

  4. Denizcilik işletmelerine yönelik entelektüel sermaye değerlemesi üzerine bir model önerisi

    A model proposal on valuation for intellectual capital of maritime businesses

    GİZEM ÇEVİK

    Doktora

    Türkçe

    Türkçe

    2023

    Denizcilikİstanbul Teknik Üniversitesi

    Deniz Ulaştırma Mühendisliği Ana Bilim Dalı

    PROF. DR. ÖZCAN ARSLAN

  5. DNS big data processing for detecting customersbehaviour of isp using an optimized apache spark cluster

    İSP müşterilerin davranışlarını tespiti için optimize edilmiş bir apache spark kümesi kullanarak dns büyük veri işleme

    YOUSEF ALKHANAFSEH

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    Elektrik ve Elektronik Mühendisliği Ana Bilim Dalı

    PROF. DR. TAHİR ÇETİN AKINCI