Geri Dön

Anahtar kelime çıkarımı için kelime vektörleri: Karşılaştırmalı bir değerlendirme

Word embdeddings for automatic keyword extraction: A comparative assessment

  1. Tez No: 759755
  2. Yazar: IRMA DIBRA
  3. Danışmanlar: DR. ÖĞR. ÜYESİ ALEV MUTLU
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2022
  8. Dil: Türkçe
  9. Üniversite: Kocaeli Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
  13. Sayfa Sayısı: 41

Özet

Anahtar kelimeler, bir belgenin içeriğini en iyi tanımlayan söz veya söz öbekleridir. Çevrimiçi dokümanların sayısı yüksek hızda artması ve anahtar kelimelerin metin sınıflandırma ve kümeleme gibi çeşitli metin işleme problemlerinde uygulanması nedeniyle daha da zorlu ve ilgi çekici bir görev haline geldi. Son zamanlarda, kelimelerin sayısal temsilleri (vektör), sözcüklerin anlamsal benzerliğini tahmin etmek için faydalı araçlar sağladığından, otomatik anahtar kelime çıkarma alanında uygulama bulmuştur. Bu çalışmada, farklı kelime vektör modellerinin tam metinden anahtar kelime çıkarmadaki başarımları irdelenmiştir. Bu amaçla Referans Vektör Algoritması (RVA) farklı kelime vektör modelleri ile çalışacak şekilde değiştirilmiş ve FAO30, Krapivin, Nguyen, Schutz, ve SemEval2010 veri seti üzerinde deneyler yapılmıştır. Elde edilen sonuçlar, GloVe ve Scibert'in her biri iki veri kümesi için en yüksek F1 @ 10 puanına ve bir veri kümesi için Word2Vec'ye ulaştığını göstermektedir. Ayrıca GloVe, üç veri kümesi için en yüksek ortalama karşılıklı sıralamaya (MRR) ve orantılı ortalama hassasiyete (MAP) ulaştı.

Özet (Çeviri)

Keywords are salient words / phrases that best describe the content of a text document. Automatic keyword extraction from text documents has become a challenging task as the amount of online text documents increases in high speed and keywords have applications in several text processing problems such as text classification and clustering. Recently, word embeddings have found application in automatic keyword extraction as these representations provide means to estimate semantic similarity of words. In this study, the performances of different word vector models in extracting keywords from full text are examined. To this aim, the Reference Vector Algorithm (RVA) was modified to work with different word vector models and experiments were conducted on the FAO30, Krapivin, Nguyen, Schutz, and SemEval2010 datasets. The experimental results show that GloVe and SciBERT achieved the highest F1@10 score for two datasets each and Word2Vec for one dataset. Moreover, GloVe achieved the highest mean reciprocal rank (MRR) and mean average precision (MAP) for three datasets.

Benzer Tezler

  1. Fake news classification using machine learning and deep learning approaches

    Makine öğrenimi ve derin öğrenme yaklaşımlarını kullanarak sahte haber sınıflandırması

    SAJA ABDULHALEEM MAHMOOD AL-OBAIDI

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ TUBA ÇAĞLIKANTAR

  2. Büyük veri tabanlarında özniteliklerin etiketlere indirgenmesine dayalı içerik tabanlı görüntü erişimi

    Content-based image retrieval based on indexing of code words and metadata attributes in large database

    HALİS YILBOĞA

    Yüksek Lisans

    Türkçe

    Türkçe

    2015

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolYıldız Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. MİNE ELİF KARSLIGİL YAVUZ

  3. Hakem atama otomasyonu için bir karar destek sistemi: Doğal dil işleme ve veri-güdümlü optimizasyon ile bütünleşik bir yaklaşım

    A decision support system for reviewer assignment automation: An integrated approach with natural language processing and data-driven optimization

    MELTEM AKSOY

    Doktora

    Türkçe

    Türkçe

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    DOÇ. DR. SEDA YANIK ÖZBAY

    PROF. DR. MEHMET FATİH AMASYALI

  4. Specific keyword extraction from unstructured curriculum vitae using deep learning methods

    Derin öğrenme yöntemleri kullanılarak özgeçmişler üzerinde anahtar kelime çıkarımı

    MUSTAFA BUĞRA DÜR

    Yüksek Lisans

    İngilizce

    İngilizce

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolÇankaya Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. HAYRİ SEVER

  5. Akademik makalelerde anahtar kelime çıkarımı için yeni yaklaşımlar

    New approaches for keyword extraction in academic articles

    FURKAN GÖZ

    Doktora

    Türkçe

    Türkçe

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKocaeli Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ALEV MUTLU