Geri Dön

A method for predicting title of given text

Verilen metnin başlığını tahmin etmek için bir yöntem

  1. Tez No: 723142
  2. Yazar: MOHAMED BARRE OMER
  3. Danışmanlar: DOÇ. DR. MUSTAFA CEM KASAPBAŞI
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2021
  8. Dil: İngilizce
  9. Üniversite: İstanbul Ticaret Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 39

Özet

Günümüzde, muazzam metin veri kaynakları her yerde kitaplar, haber dergileri, web siteleri ve çok daha fazlası şeklindedir. Metin verilerini keşfetmek ve bunlarla ilgili içgörü kazanmak çok önemlidir. Başlıklar makalenin ve tarihin bir özetini verir, anlamsal ve sözdizimsel olarak tutarlı bir başlık elde etmek oldukça zor bir iştir. Bu çalışmada, doğal bir dil üretme sistemi olan belirli bir metnin (PTT) başlığını tahmin etmek için LSTM (Long Short Term Memory) sinir sistemi adlı bir derin öğrenme sistemi önerilmiştir. Derin sinir ağı mimarisi son zamanlarda popülerlik kazanıyor ve bu, metin oluşturmak için önceki istatistiksel modellerden daha kolay. Bu çalışmada, Kaggle'ın haber özeti adı verilen halka açık haber veri kümesi kullanılmıştır. Verimlilik ve daha az işlem gücü gereksinimleri için 98403 kayıt arasından 500 yüz haber özeti alt kümesi seçilir. Önce durak sözcükleri ön işleme olarak kaldırılır, ardından noktalama işaretleri düzeltilir ve metin küçük harfe dönüştürülür. Daha sonra Porter Stemmer, metindeki kelimelerin köklerini elde etmek için kullanılmıştır. Tokenizasyondan sonra, 16 kelimelik dizilere bölünür. Sayısal değerleri LSTM'ye beslemek için kelime gömme işlemi kullanılır. Önerilen LSTM modeli, ROUGE için Rough Recall Oriented (ROUGE)'dan aldığımız sonuçlara göre ROUGE 1 Ortalama_ Recall: 0,69886, Ortalama_Presicion:0,99924, Ortalama_F1:0,69905 için insan değerlendirmesine göre yüksek kaliteli başlıklar üretti. 2 Ortalama_Hatırlatma:0,69874, Ortalama_Hassas :0,69895, Ortalama_F1:0,69884, ROUGE L Ortalama_Geri Çağırma:0,69829, Ortalama_Hassas:0,69829 Ortalama_F1:0,69829.

Özet (Çeviri)

Nowadays, tremendous text data resources are everywhere in the form of books, news journals, websites, and many more. Exploring and gaining insight into text data is very crucial. The titles give a summary of the article and history, getting a coherent semantically, and syntactically title is quite a challenging task. In this study, a deep learning system namely the LSTM (Long Short-Term Memory) neural system is proposed for predicting the title of a given text (PTT) which is a natural language generation system. Deep neural network architecture recently gains popularity, which is easier than previous statistical models for generating text. In this study publicly open news dataset is used from Kaggle called news summary for headline generation. A 500 hundred news summary subset is chosen out of 98403 records for efficiency and less processing power requirements. Firstly, stop words are removed as preprocessing then punctuations are corrected and text is transformed to lower case. Later Porter Stemmer is used to obtaining stems of the words in the text. After tokenization, it is divided into 16-word-length sequences. In order to feed numerical values to LSTM word embedding is utilized. The proposed LSTM model generated high-quality titles according to human evaluation based on results we get from Recall-Oriented Understanding for Gisting Evaluation (ROUGE) as for ROUGE 1 Average_ Recall: 0,69886, Average Precision :0,69924, Average_F1:0,69905 as for ROUGE 2 Average_Recall:0,69874, Average Precision :0,69895, Average_F1:0,69884, as for ROUGE L Average_Recall:0,69829, Average_Precision:0,69829 Average_F1:0,69829.

Benzer Tezler

  1. COVİD-19 tanısı ile Hacettepe Üniversitesi erişkin hastanesinde izlenen hastaların hastalık ile ilgili risk algıları ve yaşam tarzı değişikliği planlarının değerlendirilmesi

    Evaluation of disease-related risk perceptions and lifestyle change plans of patients followed up at Hacettepe University adult hospital with the diagnosis of COVİD-19

    KAMIL ZARNISHANOV

    Tıpta Uzmanlık

    Türkçe

    Türkçe

    2021

    İç HastalıklarıHacettepe Üniversitesi

    İç Hastalıkları Ana Bilim Dalı

    PROF. DR. GÜLAY SAİN GÜVEN

    DR. ÖĞR. ÜYESİ NURSEL ÇALIK BAŞARAN

  2. Salgın hastalıklarda aşı ve karantina etkisinin matematiksel modellemesi

    Mathematical modeling of the effect of vaccination and quarantine in epidemic diseases

    SEDA ÇELİK

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    Matematikİstanbul Teknik Üniversitesi

    Matematik Mühendisliği Ana Bilim Dalı

    DOÇ. DR. SAADET SEHER ÖZER

  3. Teknolojik gelişmelerin mekan yüzeylerine çağdaş yansımaları

    Contemporary reflections of technological developments on space surfaces

    İSMAİL BEZCİ

    Yüksek Lisans

    Türkçe

    Türkçe

    2016

    İç Mimari ve DekorasyonHacettepe Üniversitesi

    İç Mimarlık ve Çevre Tasarımı Ana Bilim Dalı

    PROF. PELİN YILDIZ

  4. TFEEC : Türkçe finansal olay çıkarım derlemi

    TFEEC : Turkish financial event extraction corpus

    KADİR ŞİNAS KAYNAK

    Yüksek Lisans

    Türkçe

    Türkçe

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. AHMET CÜNEYD TANTUĞ