Farklı kelime gömme yaklaşımlarının akademik makalelerden anahtar kelime çıkarımındaki performansının analizi
Performance analysis of various word embeddings for keyword extraction techniques from academic articles
- Tez No: 823521
- Danışmanlar: DOÇ. DR. ALEV MUTLU
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2023
- Dil: Türkçe
- Üniversite: Kocaeli Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 68
Özet
Bir metin belgesinden otomatik anahtar kelime çıkarma, metin belgesinin içeriğini en iyi şekilde tanımlayan kelimeleri veya ifadeleri belirleme problemidir. Son zamanlarda, kelime gömme yöntemleri, anlamsal bilgiyi dahil ederek performansı artırması nedeniyle anahtar kelime çıkarma alanında kullanılmaktadır. Bu çalışmada, çeşitli gömmelerin performansını anahtar kelime çıkarma üzerinde karşılaştırıyoruz. Bu amaçla, öncelikle KeyBERT adlı bir anahtar kelime çıkarma sistemini farklı gömmelerle çalışacak şekilde değiştirdik. Ardından, on farklı modeli yedi veri kümesinde çalıştırdık. Deneysel bulgular, all-mpnet-base-v2'nin Kesinlik (precision), hatırlama (recall) ve F1 puanı (F1 score), açısından diğer modellere göre istatistiksel olarak daha iyi sonuçlar elde ettiğini göstermektedir. Ayrıca, all-mpnet-base-v2, hem MAP (Mean Average Precision) ve hem de MRR (Mean Reciprocal Rank) ölçütleri için en üst düzeyde puanlar aldı ve ayrıca ortalama olarak en fazla ilgili anahtar kelimeyi geri döndürdü.
Özet (Çeviri)
Automatic keyword extraction from a text document is the problem of identifying in-text words or phrases that best describe the content of the text document. Recently, word embeddings found application in keyword extraction as they improve the performance by incorporating semantic information. In this study, we focus various embeddings and and compare their performance in keyword extraction. To this aim, firstly, we modified a keyword extraction system called KeyBERT to work with different embeddings. Then, we run the modfied application using ten models on seven benchmark datasets. The experimental findings show that all-mpnet-base-v2 achieved statistically better results over the other models in precision, recall, and F1 score. Moreover, all-mpnet-base-v2 achieved highest scores for MAP and MRR and also retrieved the most number of relevant keywords on the average.
Benzer Tezler
- Fake news classification using machine learning and deep learning approaches
Makine öğrenimi ve derin öğrenme yaklaşımlarını kullanarak sahte haber sınıflandırması
SAJA ABDULHALEEM MAHMOOD AL-OBAIDI
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ TUBA ÇAĞLIKANTAR
- Kelime gömme yaklaşımlarının iadesiz torbalanmasına dayanan uzun kısa süreli bellek mimarisi ve metin sınıflandırmasına uygulanması
Long-short term memory architecture based on non-returnable baggigng of word embedding approaches and an application to text classification
MUHAMMET OĞUZHAN YALÇIN
Doktora
Türkçe
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolMuğla Sıtkı Koçman Üniversitesiİstatistik Ana Bilim Dalı
DOÇ. DR. NEVİN GÜLER DİNCER
- Suicidal ideation detection from social media
Sosyal medya içeriğinden intihar düşüncesi algılama
ÖZAY EZERCELİ
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolIşık ÜniversitesiBilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ RAHİM DEHKHARGHANİ
- Çevrimiçi sosyal ağlarda rahatsız edici davranış tespiti ve azaltma stratejileri
Misbehaviour detection and mitigation strategies in online social networks
SEMA ŞAHİN
Yüksek Lisans
Türkçe
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolMarmara ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. AYŞE BERNA ALTINEL GİRGİN
- Analysis of context embeddings in word sense induction
Bağlam gömülerinin sözcük anlamı tümevarımda incelenmesi
OSMAN BAŞKAYA
Yüksek Lisans
İngilizce
2015
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKoç ÜniversitesiBilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı
DOÇ. DR. DENİZ YURET