Geri Dön

Dizi etiketleme temelli yeni bir karma anahtar kelime çıkarım modeli

A novel sequential labeling based hybrid keyword extraction model

  1. Tez No: 797503
  2. Yazar: HÜMA KILIÇ
  3. Danışmanlar: PROF. DR. AYDIN ÇETİN
  4. Tez Türü: Doktora
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2023
  8. Dil: Türkçe
  9. Üniversite: Gazi Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 94

Özet

Anahtar kelime çıkarımı, metin içeriğinin kümelenmesi ve bağlanmasındaki büyük zorluklardan biridir. Literatürde, anahtar kelime ve anahtar ifade çıkarımı için çeşitli makine öğrenmesi yaklaşımları önerilmiştir. Bu tezde ilk olarak literatürde önerilen modeller ve performans sonuçları iki ana başlık altında sunulmuştur. Ancak, anahtar kelime çıkarımı modellerinin performans sonuçları hala beklentilerin altındadır. Bu tez kapsamında, yeni bir hibrit anahtar kelime çıkarma modeli olan HibritAKÇ önerilmiştir. Önerilen yöntem, anahtar kelime çıkarım problemini bir dizi etiketleme görevi olarak ele almaktadır. Naive Bayes, Destek Vektör Makinesi, Çok Katmanlı Algılayıcı ve Rastgele Orman sınıflandırma algoritmaları, modelin Token Sınıflandırma modülünde ayrı ayrı eğitilmiştir. Modelde metin, grafik, gömme ve küme öznitelikleri kullanılarak Token Sınıflandırma işlemi gerçekleştirilmiştir. Modelin performansı literatürde yaygın olarak kullanılan Inspec, Semeval-2017, 500N-KPCrowd veri kümeleri ve yeni derlenen TRDizinEn ve DergiParkEn veri kümeleri kullanılarak değerlendirilmiştir. Model, tüm veri kümeleri için ortalama 0,664 F1 skoruna ulaşmıştır. En yüksek F1-skor (0,74) TRDizinEn veri seti ile elde edilmiştir.

Özet (Çeviri)

Keyword extraction is one of the main problems in clustering and linking textual content. In literature, several machine learning approaches were proposed for keyword and keyphrase extraction. In this thesis, firstly, the models proposed in the literature and their performance results are presented under two main headings. However, the state-of-the-art performance results are still below the expectations. We propose a novel hybrid keyword extraction model, HybridKEM. The proposed method addresses the keyword extraction problem as a sequence labelling task. Naive Bayes, Support Vector Machine, Multi-Layer Perceptron and Random Forest classification algorithms were trained separately in the Token Classification module of the model. The Token Classification process was performed by using text, graphic, embedding, and set features in the model. The performance of the model was evaluated using the Inspec, Semeval-2017, 500N-KPCrowd datasets, which are widely used in studies in the literature, and two newly collected, TRDizinEn and DergiParkEn datasets. The model achieved an average F1-score of 0.664 for all datasets. The highest F1-score (0.74) was obtained with the TRDizinEn dataset.

Benzer Tezler

  1. Computational harmonic analysis with rhythmical weights

    Ritmik ağırlıklarla hesaplamalı armoni analizi

    AYŞE RUHAN İKEDA

    Doktora

    İngilizce

    İngilizce

    2022

    Müzikİstanbul Teknik Üniversitesi

    Müzik Ana Bilim Dalı

    PROF. DR. CAN KARADOĞAN

  2. Zayıflama amaçlı kullanılan tıbbi çaylar üzerinde farmakognozik araştırmalar

    Pharmacognosic researches on medicinal teas used for weight loss purposes

    SALİHA BÜŞRA SAZİL

    Yüksek Lisans

    Türkçe

    Türkçe

    2021

    Eczacılık ve FarmakolojiBezm-i Alem Vakıf Üniversitesi

    Farmakognozi ve Doğal Ürünler Kimyası Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ÇAĞLA KIZILARSLAN HANÇER

  3. Towards deeply intelligent interfaces in relational databases

    İlişkisel veri tabanlarında derin akıllı arayüzler üzerine

    ARİF USTA

    Doktora

    İngilizce

    İngilizce

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİhsan Doğramacı Bilkent Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. ÖZGÜR ULUSOY

  4. Üniversite kampüsündeki araç plaka tanıma ve takibi için matematik ve algoritmik ilkeler

    University campus vehicles number plate recognition and following mathematical and algorithmic principles

    AHMED AMİR KHAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2013

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKahramanmaraş Sütçü İmam Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    DOÇ. DR. MAHİT GÜNEŞ

  5. On praxis and poiesis duality in digital virtual object representation: A thesis on consumer categories and objectness

    Dijital ve sanal nesnelerin temsilinde praxis ve poiesis ikiliği hakkında: Tüketici kategorileri ve nesnelliğe dair bir tez

    OGEDAY CELEP

    Doktora

    İngilizce

    İngilizce

    2024

    İşletmeThe University of Reading

    Pazarlama Ana Bilim Dalı

    DOÇ. DR. MICHAEL MOLESWORTH