Searching documents with semantically related keyphrases
Anlamsal olarak ilişkili anahtar kelime öbekleriyle doküman arama
- Tez No: 286245
- Danışmanlar: DOÇ. DR. NİHAN KESİM ÇİÇEKLİ, DOÇ. DR. İLYAS ÇİÇEKLİ
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2010
- Dil: İngilizce
- Üniversite: Orta Doğu Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Bölümü
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 84
Özet
Bu tezde, arama terimleriyle anlamsal olarak ilişkilendirilmiş anahtar kelime öbeklerini kullanarakarama yapmayı sağlayan SemKPSearch aracını geliştirdik. Dokümanların kelime öbeklerinianlamsal olarak ilişkilendirmekle kullanıcılara döküman kümesi üzerinde genişletilmişbir arama yeteneği sağlamayı ve elde edilen alakalı sonuçların artırılmasını hedefledik. Anahtarkelime öbekleri dokümanların içeriklerinin kısa bir özetini sunar. Anahtar kelime öbekleriyazarlar tarafından atanmış veya otomatik olarak üretilmiş olabilir. SemKPSearch dokümanlarınanahtar kelime öbeklerinden oluşturulmuş olan bir SemKPIndex dizini kullanmaktadır.SemKPIndex içerisinde anahtar kelime öbeklerinden anahtar kelime öbeklerine olan anlamsalilişki skorunun kaydedildiği bir dizin de içerecek şekilde genişletilmiş bir anahtar kelimeöbeği dizinidir. Anahtar kelime öbekleri arasındaki anlamsal ilişki skoru, öbekler içindekikelimeler arasındaki anlamsal benzerlik kullanılarak hesaplanır. İki kelime arasındaki anlamsalilişki skorunu hesaplamak için ise Wu ve Palmer kelime benzerliği ölçütü ile Li kelimebenzerliği ölçütü, iki farklı kelime tabanlı anlamsal benzerlik ölçüsü olarak kullanılmıştır.SemKPSearch bir grup bilgisayar mühendisi tarafından değerlendirilmiştir. Değerlendirmeiçin yazarların tavsiye ettiği anahtar kelime öbeklerinin yanı sıra, kelime öbeği üretimi içinbaşarılı bir algoritma olan KEA ile otomatik olarak çıkarılmış kelime öbekleri de kullanılarakoluşturulan kelime öbeği dizinleri kullanılmıştır.
Özet (Çeviri)
In this thesis, we developed SemKPSearch which is a tool for searching documents by thekeyphrases that are semantically related with the given query phrase. By relating the keyphrasessemantically, we aim to provide users an extended search and browsing capabilityover a document collection and to increase the number of related results returned for a keyphrasequery. Keyphrases provide a brief summary of the content of documents. They canbe either author assigned or automatically extracted from the documents. SemKPSearch usesSemKPIndexes which are generated with the keyphrases of the documents. SemKPIndex isa keyphrase index extended with a keyphrase to keyphrase index which stores the semanticrelation score between the keyphrases in the document collection. Semantic relation scorebetween keyphrases is calculated using a metric which considers the similarity score betweenwords of the keyphrases. The semantic similarity score between two words is determined withthe help of two word-to-word semantic similarity metrics, namely the metric of Wu&Palmerand the metric of Li et al. SemKPSearch is evaluated by the human evaluators which are allcomputer engineers. For the evaluation, in addition to the author assigned keyphrases, thekeyphrases automatically extracted by employing the state-of-the-art algorithm KEA are usedto create keyphrase indexes.
Benzer Tezler
- An ontology based representation of semantic annotations for biomedical relations extracted from scientific documents
Bilimsel belgelerden çıkarılmış biyomedikal ilişkiler için anlamsal açıklamaların ontoloji temelli temsili
BERKAY ATAMAN
Yüksek Lisans
İngilizce
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. SUSAN MICHELE ÜSKÜDARLI
- Keyphrase extraction from Arabic scientific articles
Arapça bilimsel makalelerden anahtar kelime çıkarma
FIRNAS HANCI
Yüksek Lisans
İngilizce
2015
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolÇankaya ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. GÖNENÇ ERCAN
- Dictionary-based effective and efficient Turkish lemmatizer
Sözlük tabanlı etkin ve verimli Türkçe gövdeleyici
MERT CİVRİZ
Yüksek Lisans
İngilizce
2011
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolDokuz Eylül ÜniversitesiBilgisayar Mühendisliği Bölümü
YRD. DOÇ. DR. ADİL ALPKOÇAK
- Otomatik metin özetleme sistemi
Automatic tex summarization system
AYSUN GÜRAN
Doktora
Türkçe
2013
MatematikYıldız Teknik ÜniversitesiMatematik Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. NİLGÜN GÜLER BAYAZIT
- Akademik hukuk makalelerinde atıf önerisi
Citation recommendation on scholarly legal articles
DOĞUKAN ARSLAN
Yüksek Lisans
Türkçe
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. GÜLŞEN ERYİĞİT