Geri Dön

Searching documents with semantically related keyphrases

Anlamsal olarak ilişkili anahtar kelime öbekleriyle doküman arama

  1. Tez No: 286245
  2. Yazar: İBRAHİM AYGÜL
  3. Danışmanlar: DOÇ. DR. NİHAN KESİM ÇİÇEKLİ, DOÇ. DR. İLYAS ÇİÇEKLİ
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2010
  8. Dil: İngilizce
  9. Üniversite: Orta Doğu Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Bölümü
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 84

Özet

Bu tezde, arama terimleriyle anlamsal olarak ilişkilendirilmiş anahtar kelime öbeklerini kullanarakarama yapmayı sağlayan SemKPSearch aracını geliştirdik. Dokümanların kelime öbeklerinianlamsal olarak ilişkilendirmekle kullanıcılara döküman kümesi üzerinde genişletilmişbir arama yeteneği sağlamayı ve elde edilen alakalı sonuçların artırılmasını hedefledik. Anahtarkelime öbekleri dokümanların içeriklerinin kısa bir özetini sunar. Anahtar kelime öbekleriyazarlar tarafından atanmış veya otomatik olarak üretilmiş olabilir. SemKPSearch dokümanlarınanahtar kelime öbeklerinden oluşturulmuş olan bir SemKPIndex dizini kullanmaktadır.SemKPIndex içerisinde anahtar kelime öbeklerinden anahtar kelime öbeklerine olan anlamsalilişki skorunun kaydedildiği bir dizin de içerecek şekilde genişletilmiş bir anahtar kelimeöbeği dizinidir. Anahtar kelime öbekleri arasındaki anlamsal ilişki skoru, öbekler içindekikelimeler arasındaki anlamsal benzerlik kullanılarak hesaplanır. İki kelime arasındaki anlamsalilişki skorunu hesaplamak için ise Wu ve Palmer kelime benzerliği ölçütü ile Li kelimebenzerliği ölçütü, iki farklı kelime tabanlı anlamsal benzerlik ölçüsü olarak kullanılmıştır.SemKPSearch bir grup bilgisayar mühendisi tarafından değerlendirilmiştir. Değerlendirmeiçin yazarların tavsiye ettiği anahtar kelime öbeklerinin yanı sıra, kelime öbeği üretimi içinbaşarılı bir algoritma olan KEA ile otomatik olarak çıkarılmış kelime öbekleri de kullanılarakoluşturulan kelime öbeği dizinleri kullanılmıştır.

Özet (Çeviri)

In this thesis, we developed SemKPSearch which is a tool for searching documents by thekeyphrases that are semantically related with the given query phrase. By relating the keyphrasessemantically, we aim to provide users an extended search and browsing capabilityover a document collection and to increase the number of related results returned for a keyphrasequery. Keyphrases provide a brief summary of the content of documents. They canbe either author assigned or automatically extracted from the documents. SemKPSearch usesSemKPIndexes which are generated with the keyphrases of the documents. SemKPIndex isa keyphrase index extended with a keyphrase to keyphrase index which stores the semanticrelation score between the keyphrases in the document collection. Semantic relation scorebetween keyphrases is calculated using a metric which considers the similarity score betweenwords of the keyphrases. The semantic similarity score between two words is determined withthe help of two word-to-word semantic similarity metrics, namely the metric of Wu&Palmerand the metric of Li et al. SemKPSearch is evaluated by the human evaluators which are allcomputer engineers. For the evaluation, in addition to the author assigned keyphrases, thekeyphrases automatically extracted by employing the state-of-the-art algorithm KEA are usedto create keyphrase indexes.

Benzer Tezler

  1. An ontology based representation of semantic annotations for biomedical relations extracted from scientific documents

    Bilimsel belgelerden çıkarılmış biyomedikal ilişkiler için anlamsal açıklamaların ontoloji temelli temsili

    BERKAY ATAMAN

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. SUSAN MICHELE ÜSKÜDARLI

  2. Keyphrase extraction from Arabic scientific articles

    Arapça bilimsel makalelerden anahtar kelime çıkarma

    FIRNAS HANCI

    Yüksek Lisans

    İngilizce

    İngilizce

    2015

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolÇankaya Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. GÖNENÇ ERCAN

  3. Dictionary-based effective and efficient Turkish lemmatizer

    Sözlük tabanlı etkin ve verimli Türkçe gövdeleyici

    MERT CİVRİZ

    Yüksek Lisans

    İngilizce

    İngilizce

    2011

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolDokuz Eylül Üniversitesi

    Bilgisayar Mühendisliği Bölümü

    YRD. DOÇ. DR. ADİL ALPKOÇAK

  4. Otomatik metin özetleme sistemi

    Automatic tex summarization system

    AYSUN GÜRAN

    Doktora

    Türkçe

    Türkçe

    2013

    MatematikYıldız Teknik Üniversitesi

    Matematik Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. NİLGÜN GÜLER BAYAZIT

  5. Akademik hukuk makalelerinde atıf önerisi

    Citation recommendation on scholarly legal articles

    DOĞUKAN ARSLAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. GÜLŞEN ERYİĞİT