Geri Dön

Web sayfaları için anlamsal erişim sistemi

A semantic retrieval system for Web pages

  1. Tez No: 182220
  2. Yazar: EBRU SEZER
  3. Danışmanlar: PROF.DR. ADNAN YAZICI, PROF.DR. ÜNAL YARIMAĞAN
  4. Tez Türü: Doktora
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Bulanık Ontoloji, Anlamsal Erişim, İçerik Tabanlı Erişim, OWL, RDF, RDFS, Fuzzy ontology, Semantic Web & Retrieval, Content based retrieval, OWL, RDF, RDFS
  7. Yıl: 2006
  8. Dil: Türkçe
  9. Üniversite: Hacettepe Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 215

Özet

Günümüzde internetin içerdiği web sayfalarının çeşitliliği ve sayısı sebebi ile engeniş çoklu ortam derlemi olduğu söylenebilir. Veri türünün böylesine çeşitlendiğive hacminin büyük olduğu bir ortamda ihtiyaca karşılık gelen bilgiye erişim;anlamsal erişim, içerik tabanlı erişim, nesne tanıma ve etiketlendirme, internetteknolojileri gibi alanlar için halen açık bir problemdir. Geliştirilen tez, kullandığıstandartlar ve metodoloji uyumu sebebi ile Anlamsal Web konu başlığı altında yeralmaktadır. Çalışmada tanımlanan problem ?farklı veri türlerinin aynı sorgucümleciği ile sorgulanabilmesi? olarak özetlenebilir. Bu sorgulama biçiminingerekliliği, farklı veri türlerinin kullanılma gerekliliğinden kaynaklanır. Yani farklıveri türleri bir anlamı vurgulamak ya da anlamı zenginleştirmek için kullanılır.Başka bir deyişle sayfanın anlamsal özelliklerini yatayda ya da dikeydegenişletirler. Bu katkının ele alınabilmesi için farklı veri türleri benzer biçimdedizinlenmeli ve sorgulanmalıdır.Tezde seçilen veri türleri metin ve görüntülerdir. Bu seçimin sebebi, her iki veritürünün daha sık birlikte kullanımı ve birbirini tamamlayabilme ilişkileridir.Dizinlemede öncelikle içerik özellikleri çıkarılır. Metinler için Vektör Uzayı Modelikullanılır. Görüntülerde nesneler elle etiketlenir ve konumsal ilişkiler otomatikçıkarılır. Üretilen içerik özellikleri ve bulanık alan ontolojisi anlamsal özelliklerinçıkarımında kullanılır. Sayfanın anlamsal ve içerik özellikleri sayfa üst verisindesaklanır. Kullanıcı sorguları bu üst veriler üzerinde işlenir.Bulanık ontoloji, önerilen NEK(Nesne, Eylem, Kavram) Modeli'ne göre araçkullanılarak geliştirilir. Bu öneri ile bir alanın, üç farklı katman aracılığı ile somut-soyut ya da varlık-anlam aralığında modellenebilmesi amaçlanmıştır. Kullanılanontoloji gösterim dili Web Ontology Language (OWL) ve sorgulama dili RDF DataQuery Language (RDQL)'dir.Sistemin başarımı biri gerçek ve diğeri sentetik olmak üzere toplam 2 ayrı deneykümesi üzerinde anma (recall), duyarlık (precision) ve Rnorm parametreleri ileiölçülmüştür. Sistemin anma ve Rnorm değerlerinde olumlu katkısı gözlenmiştir. Bugözlem ile farklı veri türlerinin, sayfanın anlamsallığını zenginleştirdiği düşüncesidesteklenmiştir.

Özet (Çeviri)

Information retrieval from web pages is still open problem for different topics:content based retrieval, semantic retrieval, object recognition, internettecnologies…etc. This thessis is placed under semantic retrieval topic for itsaccordance to semantic web standarts and methodologies. It represents a modelfor semantic retrieval of web pages. The problem of the model can be summarisedas ?querying different data types by using same query sentence?. The necessity ofthis querying style comes from necessity of different data types usage. Thismeans, different data types are used to emphasize some meanings or to increaserichness of the meaning. In other words, it enables vertical or horizantalexpansions on the web page semantics. This semantic contribution can behandled by indexing and querying different data types in the same style.In this study, text and images are selected as different data types. Because theirtogether usage are more frequently encountered and they have semanticcomplementary relationship between each other. In the indexing process, firstly,content features of each data types are extracted. Vector space model is used fortexts. Manual object annotation and automatic spatial relation extraction are usedfor images. Produced content features and a fuzzy domain ontology are used asinput for semantic feature extraction process. This means, semantics of the webpage is union of semantics of text and images. Produced semantic features arestored in the meta data of the web page with its content features. These metadatas can be queried by user.Fuzzy domain ontology is developed by tool accoding to suggested ontologymodel called OAC(Object, Action, Concept) Model. The aim of the model is tocontain all terms between concrete and abstract or entity and meaning interval.Ontology Web Language (OWL) is used to represent domain ontology and RDFData Query Language (RDQL ) is used to query meta datas.iiiPerformance of the system is measured by recall, precision and Rnorm parameterson two different experiment sets like real data and synthetic data. Positivecontributions are observed on recall and Rnorm parameters. This observationsupports that usage of different data types provides to increase richness or toemphasize semantics of the web page.

Benzer Tezler

  1. Detection of phishing web pages by combining semantical and visual information

    Kimlik avcısı web sayfalarının anlamsal ve görsel bilgiyle tespiti

    AHMAD HANI ABDALLA ALMAKHAMREH

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHacettepe Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ AHMET SELMAN BOZKIR

  2. Bilişimde ontoloji kavramı ve istatistik ontolojisi

    The concept of ontology in informatics and the ontology of statistics

    GÜLSEN ŞENGÜN

    Yüksek Lisans

    Türkçe

    Türkçe

    2015

    Bilim ve TeknolojiBaşkent Üniversitesi

    İstatistik ve Bilgisayar Bilimleri Ana Bilim Dalı

    DOÇ. DR. MEHTAP AKÇİL OK

  3. Web usage mining and recommendation with semantic information

    Anlamsal bilgiler ile web kullanım madenciliği ve önerim

    SÜLEYMAN SALIN

    Yüksek Lisans

    İngilizce

    İngilizce

    2009

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik Üniversitesi

    Bilgisayar Mühendisliği Bölümü

    YRD. DOÇ. DR. PINAR ŞENKUL

  4. Türkçe derlemden anlamsal ilişkilerin çıkartılması

    Semantic relation extraction from turkish corpus

    GÜRKAN ŞAHİN

    Yüksek Lisans

    Türkçe

    Türkçe

    2016

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolYıldız Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. BANU DİRİ

  5. Ontoloji tabanlı bir anlamsal ilintililik yöntemi geliştirilmesi ve yöntemin metin bağdaşıklığının otomatik olarak ölçümünde kullanılması

    Development of an ontology-based semantic relatedness measurement method and its application to automatic measurement of text coherence

    GÖRKEM GİRAY

    Doktora

    Türkçe

    Türkçe

    2011

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolEge Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. MURAT OSMAN ÜNALIR