Geri Dön

Arabic text summarization using pagerank and word embedding algorithms

Pagerank ve kelime gömme algoritmaları kullanarak Arapça metin özetleme

  1. Tez No: 753032
  2. Yazar: GHADIR ABDULHAKIM ABDO ABDULLAH ALSELWI
  3. Danışmanlar: DR. ÖĞR. ÜYESİ TUĞRUL TAŞCI
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2022
  8. Dil: İngilizce
  9. Üniversite: Sakarya Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilişim Sistemleri Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 83

Özet

Arapça, 200 milyondan fazla insanın ilk dili olarak kullandığı, dünyanın en sık konuşulan dillerinden biridir ve 26 ülkenin resmi dilidir. Arapça metin özetleme (ArTS) son yıllarda popülaritesini artırmış olsa da, mevcut ATS sistemlerinin kalitesinin iyileştirilmesi gerekmektedir. Arapça doğal dil işlemede grafik tabanlı teknikler son yıllarda açıkça popülerlik kazanmıştır. Büyük ve zor yapıları standart ve biçimsel yollarla düzenleme yeteneklerinden dolayı, grafikler Arapça dil zorluklarını fethetmeye ve en aza indirmeye yardımcı olmak için yararlı bir şekilde kullanılabilir ve geliştirilebilir. Bu çalışma, tek belgeli bir Grafik tabanlı Ekstraktif Arapça Metin Özetleme (GEATS) önerdi. PageRank yöntemi, kelime gömme ile birlikte kullanılır. Herhangi iki cümlenin benzerliği, cümlelerin kosinüs benzerliğine göre sıralanmasıyla hesaplanır. Her cümle için nihai puan PageRank puanlaması kullanılarak belirlenir ve yüksek puan alan cümleler, belgenin cümlelerinin %40'ı olan sıkıştırma oranı dikkate alınarak özete dahil edilir. Bu tekniğin performansını test etmek için EASC Corpus kullanıldı. ROUGE-1, ROUGE-2 ve BLUE metrikleri de değerlendirme sürecinde kullanılmaktadır. Bulgular, önerilen yöntemin en gelişmiş yaklaşımlardan daha iyi performans gösterdiğini göstermiştir.

Özet (Çeviri)

Arabic is one of the world's most frequently spoken languages, with over 200 million people using it as their first language, and it is the official language of 26 nations. Although Arabic text summarization (ArTS) has increased in popularity in recent years, the quality of current ATS systems need improvement. Graph-based techniques on Arabic natural language processing have clearly gained popularity in recent years. Because of their ability to arrange large and difficult structures into standard and formal ways, graphs may be used and developed in a helpful way to assist in conquering and minimizing Arabic language challenges. This study proposed a single-document Graph-based Extractive Arabic Text Summarization (GEATS). The PageRank method is used, along with word embedding. The similarity of any two sentences is calculated by ranking the sentences based on cosine similarity. The final score for each sentence is determined using PageRank scoring. Then, the summary includes the sentences with the highest ratings taking into account the compression ratio, which is 40% of the document's sentences. The EASC Corpus is used as a standard corpus to test the performance of this technique. ROUGE-1, ROUGE-2, and BLUE metrics are also employed in the evaluation process. The findings demonstrated that the proposed strategy outperforms state-of-the-art approaches.

Benzer Tezler

  1. Türkçe doğal dil metinlerinden python programlama dili kodu üretilmesi

    Generation of python programming language code from Turkish natural language texts

    AYŞEGÜL HATİPOĞLU

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBursa Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. TURGAY TUGAY BİLGİN

  2. التنصيص في شرح شواهد التلخيص للإمام إبراهيم وحدي بن مصطفى بن محمد بن درسون الشمني،وحدي أفندي (ت 1126 هـــ)من شواهد الفن الثاني (علم البيان) إلى نهاية المخطوط، دراسة وتحقيق. 3

    Vahdi İbrahim Efendi'nin (H. 1126) et-Tansîs fî Şerhi Şevahidi't-Telhîs eserinin ikinci bölümünden kitabın sonuna kadar ki kısmının tahkiki ve belagat çalışması

    HASANAIN GHAZİ KAREEM AL-SAMMARRAIE

    Yüksek Lisans

    Arapça

    Arapça

    2022

    DinÇankırı Karatekin Üniversitesi

    Temel İslam Bilimleri Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ KUTAİBA FARHAT

  3. Derin öğrenme metodlarını kullanarak arapça metin tabanlı duygu analizi

    Arabic text-based senti̇ment analysi̇s using deep learning methods

    MARIAM ABAKAR NOKOUR

    Yüksek Lisans

    Türkçe

    Türkçe

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolEskişehir Osmangazi Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. EYYÜP GÜLBANDILAR

  4. Öznitelik seçme teknikleri ve genetik algoritma kullanılarak etkin arapça metin sınıflandırması

    Efficient arabic text classification using feature selection techniques and genetic algorithm

    AHMED HASHIM KAREEM AL-DULAIMI

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolYalova Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ MURAT OKKALIOĞLU

  5. Classification of arabic text using convolutional neural networks

    Konvolutıonal neural ağları kullanılan arabıc metinin sınıflandırması

    BILAL SHAKIR FARAJ ALKHASAWE

    Yüksek Lisans

    İngilizce

    İngilizce

    2018

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolErciyes Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ FEHİM KÖYLÜ