Geri Dön

A user based comparative study of automatic text summarization

Otomatik metin özetlemede kullanıcı tabanlı karşılaştırma çalışması

  1. Tez No: 521773
  2. Yazar: NAJMA ABDI OMAR
  3. Danışmanlar: PROF. DR. NEVCİHAN DURU
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2018
  8. Dil: İngilizce
  9. Üniversite: Kocaeli Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 105

Özet

Her geçen zamanda, metinsel verilerdeki büyüklük devasa ölçülerde olmaktadır. Orta düzeyde bir kullanıcı, normalde işleyebileceğinden daha fazla bilgi ile karşılaşmaktadır. Uzmanlık seviyesinden bağımsız olarak, her kullanıcı kendi ilgi alanına göre, bir şeyler anlatmakta olup, ilaveten teknolojinin gelişmesi ve sosyal medyanın kullanımındaki artışla birlikte, hem sayı hem de boyutta fikir ve haber makalesi sayısı artmıştır. Bu verilerden okurken, değerli malzemelere ulaşma olasılığı daha da azalmakta, dolayısıyla metin özetlemesi gibi teknolojik yeniliklere duyulan ihtiyaç da artmaktadır. Otomatik Metin Özetlemesi, mevcut bilgi miktarını azaltmak için doğal dil işleme ve yapay zekâ gibi alanlarda kullanır. Bu anlamda, otomatik metin özetleme, hangi makalenin daha fazla okunacağına ve hangisinin önemsiz olduğuna karar vermek için bir araç olarak kullanılabilen önemli bir araçtır. Bu tez, dört farklı algoritmanın karşılaştırmalı bir çalışmasını içermektedir; Gensim TextRank, Sumy LSA, bir frekans olay tabanlı özetleme ve bir duygu analizi tabanlı özetleyici. Çalışmanın değerlendirmesinde, özetlemenin, ortalama bir kullanıcının bir kullanıcı geribildirim anketi yoluyla özetleyicileri puanlama yöntemiyle insan bilgisayar etkileşim çalışması olarak yapılmış ve değerlendirme metrikleri Rouge puanlarıyla karşılaştırılmıştır. Tezde tanımlanan çalışma, otomatik metin özetlemesinin bir arka plan çalışmasını, dört algoritmanın karşılaştırmalı bir incelemesini ve özetleyicilerin değerlendirilmesini içermektedir.

Özet (Çeviri)

Every second that goes by, textual data is generated in magnitudes. The average user is met with more information than they could ordinarily process. With the advent of technology and the rise in the use of social media, opinions and news article extracts have grown in both number and size, every user regardless of expertise level has something to tell the world. In navigating this data, the possibility of getting worthy material is getting slimmer hence the need for technological innovations like text summarization. Automatic Text summarization uses knowledge in the fields like natural language processing and artificial intelligence to downsize on the amount of existing information. It is a great asset that can be used as a tool to decide which article to read further and which one to discard. In this thesis, the work done involves a comparative study of four different algorithm; Gensim TextRank-Based, Sumy LSA-based (borrowed from the original implementation), a frequency event based summarization (simple summarizer) and a sentiment analysis based summarizer. In the evaluation of the study, due to the fact that summarization is centred towards making the work of the average user simpler, a popular Human Computer interaction study was borrowed to score the summarizers through a usability study and a user feedback survey. The evaluation metrics was compared to Rouge scores. The work described in the thesis include a background study of automatic text summarization, a comparative study of the four algorithms and evaluation of the summarizers.

Benzer Tezler

  1. Kullanıcı destek sistemlerinde yardım biletlerinin otomatik sınıflandırılması

    Automatic classification of help tickets in user support systems

    MÜCAHİT ALTINTAŞ

    Yüksek Lisans

    Türkçe

    Türkçe

    2014

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. AHMET CÜNEYD TANTUĞ

  2. Özellik seçimi algoritmaları kullanılarak heyelanda etkili faktörlerin belirlenmesi ve heyelan duyarlılık haritalarının üretilmesi

    Determination of effective factors using feature selection algorithms and production of landslide susceptibility maps

    EMREHAN KUTLUĞ ŞAHİN

    Doktora

    Türkçe

    Türkçe

    2017

    Jeodezi ve Fotogrametriİstanbul Teknik Üniversitesi

    Geomatik Mühendisliği Ana Bilim Dalı

    PROF. DR. CENGİZHAN İPBÜKER

    PROF. DR. TAŞKIN KAVZOĞLU

  3. Kıyı yapısı inşaatları için iş güvenliği risk yönetim sistemi

    Occupational safety risk management system for coastal structure construction

    DİNÇER İNANÇ YILMAZ

    Doktora

    Türkçe

    Türkçe

    2024

    Mühendislik Bilimleriİstanbul Teknik Üniversitesi

    İnşaat Mühendisliği Ana Bilim Dalı

    DOÇ. DR. DENİZ ARTAN

  4. M bus protokolü ile sayaçların uzaktan okunması

    Remote reading of meters with M bus protocol

    TUNÇ GÜVEN

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    Elektrik ve Elektronik MühendisliğiGazi Üniversitesi

    İleri Teknolojiler Ana Bilim Dalı

    PROF. DR. MÜSLÜM CENGİZ TAPLAMACIOĞLU