Geri Dön

Türkçe metinlerde çıkarım tabanlı otomatik metin özetleme

Extractive based automatic text summarization in Turkish texts

  1. Tez No: 779797
  2. Yazar: ERTÜRK ERDAĞI
  3. Danışmanlar: DR. ÖĞR. ÜYESİ VOLKAN TUNALI
  4. Tez Türü: Doktora
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2023
  8. Dil: Türkçe
  9. Üniversite: Maltepe Üniversitesi
  10. Enstitü: Lisansüstü Eğitim Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
  13. Sayfa Sayısı: 107

Özet

Tez çalışmasında çıkarım tabanlı metin özetleme yönteminin Türkçe metinlerde kullanımına ilişkin cümle derecelendirme yöntemleri deneysel çalışma olarak yürütülmüş, literatürde bulunan yöntemlere ek olarak yeni yöntemler önerilmiştir. Ulusal haber sitelerinde bulunan içeriklerden elde edilen haber metinleri veri seti olarak kullanılmış, bu veri setinde üç farklı kullanıcının özet çalışması yapılmış ve bu özet çalışmaları daha sonra tek bir sonuca indirgenmiştir. Kontrol veri seti olarak tanımlanan bu kısım oluşturulacak özet ile başarımın değerlendirilmesi için kullanılmıştır. Literatürde mevcut olan cümle derecelendirme yöntemlerine ek olarak büyük ünlü uyumu, küçük ünlü uyumu ve bu iki kuralın birlikte denendiği hibrit bir model önerilmiştir. Önerilen üç yöntemin değerlendirilmesi ROUGE ve BLEU metrikleri ile ölçümlenmiş ve sonucunda geleneksel yöntemlerden daha iyi sonuç verdiği gözlemlenmiştir. İki metrik ile değerlendirmenin yanı sıra özetleme çalışması bir sınıflandırma problemi olarak ele alınmış, literatürde bulunan dört farklı sınıflandırma algoritması bu çalışmada kullanılmıştır. Çalışma önerilen yöntemlerin salt kullanımı, geleneksel yöntemlerin salt kullanımı ve her iki yöntemin birlikte kullanıldığı hibrit yöntem üç ayrı başlıkta değerlendirilmiş ve önerilen yöntemlerin üç algoritmada en iyi sonucu, bir algoritmada ise hibrit yöntemin en iyi sonucu verdiği gözlemlenmiştir.

Özet (Çeviri)

In this thesis study, sentence grading methods related to the use of extractive text summarization method in Turkish texts were carried out as an experimental study, and new methods were proposed in addition to the methods found in the literature. The news texts obtained from the contents of the national news sites were used as a data set, a summary study of three different users was carried out in this data set, and these summary studies were later reduced to a single result. This part, defined as the control data set, was used to evaluate the performance with the summary to be created. In addition to the sentence grading methods available in the literature, major vowel harmony, minor vowel harmony, and a hybrid model in which these two rules are tested together were proposed. Evaluation of the three proposed methods was measured with ROUGE and BLEU metrics, and it was observed that it gave better results than the traditional methods. The summarization study was handled as a classification problem in addition to the evaluation with two metrics, and four different classification algorithms in the literature were used in this study. In the study, the use of only the proposed methods, the use of only the traditional methods and the hybrid method in which both methods are used together were evaluated in three different sections and it was observed that the proposed methods gave the best result in three algorithms and the hybrid method gave the best result in one algorithm.

Benzer Tezler

  1. Makine öğrenmesi kullanarak metin özetleme

    Text summarization using machine learning

    GÜLNİHAL UYKUN

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSüleyman Demirel Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ARİF KOYUN

  2. Makine öğrenmesi yöntemleri ile türkçe haberlerin özetlenmesi

    Summarization of turkish news with machine learning

    BURAK ÖZDEMİR

    Yüksek Lisans

    Türkçe

    Türkçe

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Üniversitesi

    Enformatik Ana Bilim Dalı

    DOÇ. DR. ÇİĞDEM EROL

  3. Exploiting information extraction techniques for automatic semantic annotation and retrieval of news videos in Turkish

    Türkçe haber videolarının otomatik anlamsal etiketlenmeleri ve erişimleri için bilgi çıkarım tekniklerinin kullanımı

    DİLEK KÜÇÜK

    Doktora

    İngilizce

    İngilizce

    2011

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik Üniversitesi

    Bilgisayar Mühendisliği Bölümü

    PROF. DR. ADNAN YAZICI

  4. Derin öğrenme yöntemleri ile Türkçe metinlerde benzerlik tespiti

    Detection of similarities with deep learning methods in Turkish texts

    İRFAN AYGÜN

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolFırat Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. AHMET BEDRİ ÖZER

  5. TFEEC : Türkçe finansal olay çıkarım derlemi

    TFEEC : Turkish financial event extraction corpus

    KADİR ŞİNAS KAYNAK

    Yüksek Lisans

    Türkçe

    Türkçe

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. AHMET CÜNEYD TANTUĞ