Anahtar kelime çıkarımı için kelime vektörleri: Karşılaştırmalı bir değerlendirme
Word embdeddings for automatic keyword extraction: A comparative assessment
- Tez No: 759755
- Danışmanlar: DR. ÖĞR. ÜYESİ ALEV MUTLU
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2022
- Dil: Türkçe
- Üniversite: Kocaeli Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
- Sayfa Sayısı: 41
Özet
Anahtar kelimeler, bir belgenin içeriğini en iyi tanımlayan söz veya söz öbekleridir. Çevrimiçi dokümanların sayısı yüksek hızda artması ve anahtar kelimelerin metin sınıflandırma ve kümeleme gibi çeşitli metin işleme problemlerinde uygulanması nedeniyle daha da zorlu ve ilgi çekici bir görev haline geldi. Son zamanlarda, kelimelerin sayısal temsilleri (vektör), sözcüklerin anlamsal benzerliğini tahmin etmek için faydalı araçlar sağladığından, otomatik anahtar kelime çıkarma alanında uygulama bulmuştur. Bu çalışmada, farklı kelime vektör modellerinin tam metinden anahtar kelime çıkarmadaki başarımları irdelenmiştir. Bu amaçla Referans Vektör Algoritması (RVA) farklı kelime vektör modelleri ile çalışacak şekilde değiştirilmiş ve FAO30, Krapivin, Nguyen, Schutz, ve SemEval2010 veri seti üzerinde deneyler yapılmıştır. Elde edilen sonuçlar, GloVe ve Scibert'in her biri iki veri kümesi için en yüksek F1 @ 10 puanına ve bir veri kümesi için Word2Vec'ye ulaştığını göstermektedir. Ayrıca GloVe, üç veri kümesi için en yüksek ortalama karşılıklı sıralamaya (MRR) ve orantılı ortalama hassasiyete (MAP) ulaştı.
Özet (Çeviri)
Keywords are salient words / phrases that best describe the content of a text document. Automatic keyword extraction from text documents has become a challenging task as the amount of online text documents increases in high speed and keywords have applications in several text processing problems such as text classification and clustering. Recently, word embeddings have found application in automatic keyword extraction as these representations provide means to estimate semantic similarity of words. In this study, the performances of different word vector models in extracting keywords from full text are examined. To this aim, the Reference Vector Algorithm (RVA) was modified to work with different word vector models and experiments were conducted on the FAO30, Krapivin, Nguyen, Schutz, and SemEval2010 datasets. The experimental results show that GloVe and SciBERT achieved the highest F1@10 score for two datasets each and Word2Vec for one dataset. Moreover, GloVe achieved the highest mean reciprocal rank (MRR) and mean average precision (MAP) for three datasets.
Benzer Tezler
- Fake news classification using machine learning and deep learning approaches
Makine öğrenimi ve derin öğrenme yaklaşımlarını kullanarak sahte haber sınıflandırması
SAJA ABDULHALEEM MAHMOOD AL-OBAIDI
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ TUBA ÇAĞLIKANTAR
- Büyük veri tabanlarında özniteliklerin etiketlere indirgenmesine dayalı içerik tabanlı görüntü erişimi
Content-based image retrieval based on indexing of code words and metadata attributes in large database
HALİS YILBOĞA
Yüksek Lisans
Türkçe
2015
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolYıldız Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. MİNE ELİF KARSLIGİL YAVUZ
- Hakem atama otomasyonu için bir karar destek sistemi: Doğal dil işleme ve veri-güdümlü optimizasyon ile bütünleşik bir yaklaşım
A decision support system for reviewer assignment automation: An integrated approach with natural language processing and data-driven optimization
MELTEM AKSOY
Doktora
Türkçe
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
DOÇ. DR. SEDA YANIK ÖZBAY
PROF. DR. MEHMET FATİH AMASYALI
- Specific keyword extraction from unstructured curriculum vitae using deep learning methods
Derin öğrenme yöntemleri kullanılarak özgeçmişler üzerinde anahtar kelime çıkarımı
MUSTAFA BUĞRA DÜR
Yüksek Lisans
İngilizce
2021
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolÇankaya ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. HAYRİ SEVER
- Akademik makalelerde anahtar kelime çıkarımı için yeni yaklaşımlar
New approaches for keyword extraction in academic articles
FURKAN GÖZ
Doktora
Türkçe
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKocaeli ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ALEV MUTLU