Geri Dön

Farklı kelime gömme yaklaşımlarının akademik makalelerden anahtar kelime çıkarımındaki performansının analizi

Performance analysis of various word embeddings for keyword extraction techniques from academic articles

  1. Tez No: 823521
  2. Yazar: GHAITH M I ASHQAR
  3. Danışmanlar: DOÇ. DR. ALEV MUTLU
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2023
  8. Dil: Türkçe
  9. Üniversite: Kocaeli Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 68

Özet

Bir metin belgesinden otomatik anahtar kelime çıkarma, metin belgesinin içeriğini en iyi şekilde tanımlayan kelimeleri veya ifadeleri belirleme problemidir. Son zamanlarda, kelime gömme yöntemleri, anlamsal bilgiyi dahil ederek performansı artırması nedeniyle anahtar kelime çıkarma alanında kullanılmaktadır. Bu çalışmada, çeşitli gömmelerin performansını anahtar kelime çıkarma üzerinde karşılaştırıyoruz. Bu amaçla, öncelikle KeyBERT adlı bir anahtar kelime çıkarma sistemini farklı gömmelerle çalışacak şekilde değiştirdik. Ardından, on farklı modeli yedi veri kümesinde çalıştırdık. Deneysel bulgular, all-mpnet-base-v2'nin Kesinlik (precision), hatırlama (recall) ve F1 puanı (F1 score), açısından diğer modellere göre istatistiksel olarak daha iyi sonuçlar elde ettiğini göstermektedir. Ayrıca, all-mpnet-base-v2, hem MAP (Mean Average Precision) ve hem de MRR (Mean Reciprocal Rank) ölçütleri için en üst düzeyde puanlar aldı ve ayrıca ortalama olarak en fazla ilgili anahtar kelimeyi geri döndürdü.

Özet (Çeviri)

Automatic keyword extraction from a text document is the problem of identifying in-text words or phrases that best describe the content of the text document. Recently, word embeddings found application in keyword extraction as they improve the performance by incorporating semantic information. In this study, we focus various embeddings and and compare their performance in keyword extraction. To this aim, firstly, we modified a keyword extraction system called KeyBERT to work with different embeddings. Then, we run the modfied application using ten models on seven benchmark datasets. The experimental findings show that all-mpnet-base-v2 achieved statistically better results over the other models in precision, recall, and F1 score. Moreover, all-mpnet-base-v2 achieved highest scores for MAP and MRR and also retrieved the most number of relevant keywords on the average.

Benzer Tezler

  1. Fake news classification using machine learning and deep learning approaches

    Makine öğrenimi ve derin öğrenme yaklaşımlarını kullanarak sahte haber sınıflandırması

    SAJA ABDULHALEEM MAHMOOD AL-OBAIDI

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ TUBA ÇAĞLIKANTAR

  2. Kelime gömme yaklaşımlarının iadesiz torbalanmasına dayanan uzun kısa süreli bellek mimarisi ve metin sınıflandırmasına uygulanması

    Long-short term memory architecture based on non-returnable baggigng of word embedding approaches and an application to text classification

    MUHAMMET OĞUZHAN YALÇIN

    Doktora

    Türkçe

    Türkçe

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolMuğla Sıtkı Koçman Üniversitesi

    İstatistik Ana Bilim Dalı

    DOÇ. DR. NEVİN GÜLER DİNCER

  3. Suicidal ideation detection from social media

    Sosyal medya içeriğinden intihar düşüncesi algılama

    ÖZAY EZERCELİ

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolIşık Üniversitesi

    Bilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ RAHİM DEHKHARGHANİ

  4. Çevrimiçi sosyal ağlarda rahatsız edici davranış tespiti ve azaltma stratejileri

    Misbehaviour detection and mitigation strategies in online social networks

    SEMA ŞAHİN

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolMarmara Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. AYŞE BERNA ALTINEL GİRGİN

  5. Analysis of context embeddings in word sense induction

    Bağlam gömülerinin sözcük anlamı tümevarımda incelenmesi

    OSMAN BAŞKAYA

    Yüksek Lisans

    İngilizce

    İngilizce

    2015

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKoç Üniversitesi

    Bilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı

    DOÇ. DR. DENİZ YURET