Geri Dön

Machine learning based approach for text summarization

Metin özetlemesi için makine öğrenmesi tabanlı yaklaşım

  1. Tez No: 878177
  2. Yazar: HASSAN SHAHBAZ
  3. Danışmanlar: YRD. DOÇ. DR. ABDULLAHİ ABDU IBRAHIM
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2023
  8. Dil: İngilizce
  9. Üniversite: Altınbaş Üniversitesi
  10. Enstitü: Lisansüstü Eğitim Enstitüsü
  11. Ana Bilim Dalı: Bilgi Teknolojileri Ana Bilim Dalı
  12. Bilim Dalı: Bilgi Teknolojileri Bilim Dalı
  13. Sayfa Sayısı: 64

Özet

Modern dijital çağda, metinsel verilerin bolluğu hem zorluklara hem de fırsatlara yol açmıştır. Bu araştırma, Kupiec'in temel çerçevesini temel alan bir makine öğrenimi yaklaşımı kullanarak eğitilebilir metin özetleyicileri geliştirmeyi amaçlayarak metin özetlemenin inceliklerini araştırıyor. Titiz deneyler yoluyla, otomatik olarak oluşturulan özetleri manuel olarak hazırlanmış özetlerle karşılaştırarak önemli bulgulara ışık tuttuk. Araştırmalarımız, geleneksel yöntemleri sürekli olarak aşan Naive Bayes sınıflandırıcısını kullanan eğitilebilir yöntemin önemini ortaya çıkardı. Ayrıca sınıflandırıcının özellikle Naive Bayes ile C4.5 karar ağacı arasından yaptığı seçim, özetleyicinin performansında belirleyici bir faktör olarak ortaya çıktı. Yalnızca sonuçları ölçmenin ötesinde, araştırmamızın daha derin sonuçları, gelişmiş sinir ağlarıyla potansiyel entegrasyonlara, özellikle de derin öğrenmenin gelişmiş analitik yeteneklerinden yararlanmanın ümit verici beklentilerine işaret etti. Önümüzdeki dönem muhtemelen anlamsal özetlemeyi vurgulayacak, bağlamın önemini, çok dilli yeterliliği ve sözdizimsel kısalık ile özün korunması arasındaki hassas dengeyi savunacaktır. Ufuk tasavvur eden kişiselleştirilmiş özetleme, bir sonraki sınır olarak ortaya çıkıyor ve özetlerin uyarlanabilir bir geri bildirim mekanizmasıyla desteklenen bireysel yankıları yansıttığı bir alanı ima ediyor. Dijital alan gerçek zamanlı dinamizmle güçlendikçe, özetleme araçlarımız da bu evrime paralel olmalı ve geniş Nesnelerin İnterneti (IoT) ile potansiyel entegrasyona işaret etmelidir. Bu teknik atılımların ortasında etik hususlar hâlâ en önemli konu olmaya devam ediyor. Önyargılardan ve artırılmış şeffaflıktan arındırılmış tarafsız özetleme, araştırmanın yol gösterici yıldızı haline gelir. Özünde bu araştırma, günümüzün hızlanan bilgi çağında metin özetlemenin hayati rolünü vurgulamaktadır. Teknolojik atılımları etik dayanaklara kadar kapsayan kapsayıcı bir bakış açısının benimsenmesi, kısa ve öz, ilişkilendirilebilir ve sorumlu bilgi sentezinin geleceğini şekillendirecektir.

Özet (Çeviri)

In the modern digital era, the abundance of textual data has opened both challenges and opportunities. This research delves into the nuances of text summarization, aiming to develop trainable text summarizers using a machine learning approach, building on Kupiec's foundational framework. Through rigorous experimentation, we contrasted automatically produced summaries against those manually crafted, shedding light on pivotal findings. Our investigations revealed the prominence of the trainable method deploying the Naive Bayes classifier, which consistently surpassed traditional methods. Additionally, the classifier's selection, particularly between Naive Bayes and the C4.5 decision tree, emerged as a determinative factor in the summarizer's performance. Beyond merely quantifying outcomes, the deeper implications of our research pointed towards potential integrations with advanced neural networks, especially the tantalizing prospects of leveraging deep learning's sophisticated analytical capabilities. The forthcoming era is likely to emphasize semantic summarization, championing the importance of context, multi-lingual proficiency, and the delicate balance between syntactical brevity and essence preservation. Envisioning the horizon, personalized summarization emerges as the next frontier, alluding to a realm where summaries echo individual resonances, underpinned by an adaptive feedback mechanism. As the digital realm amplifies in real-time dynamism, our summarization tools must parallel this evolution, signifying potential integration with the expansive Internet of Things (IoT). Amidst these technical strides, ethical considerations remain paramount. Neutral summarization, devoid of biases and augmented transparency, becomes the research's guiding star. In essence, this research emphasizes the crucial role of text summarization in today's accelerating information age. Adopting an encompassing perspective, spanning technological breakthroughs to ethical anchors, will sculpt the future of succinct, relatable, and responsible information synthesis.

Benzer Tezler

  1. Automated query-biased and structure-preserving document summarization for web search tasks

    Arama motorları için bilgi isteğine ve metin yapısına dayalı olarak otomatik doküman özetlenmesi

    FATMA CANAN PEMBE

    Doktora

    İngilizce

    İngilizce

    2010

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. TUNGA GÜNGÖR

  2. Learning logic rules from text using statistical methods for natural language processing

    İstatistiksel yöntemler kullanarak doğal dil işleme amacıyla mantıksal kural öğrenmesi

    MISHAL KAZMI

    Doktora

    İngilizce

    İngilizce

    2017

    Elektrik ve Elektronik MühendisliğiSabancı Üniversitesi

    Elektrik Mühendisliği Ana Bilim Dalı

    PROF. DR. YÜCEL SAYGIN

    YRD. DOÇ. DR. PETER SCHÜLLER

  3. Graph-based keyword extraction method for scientific publications

    Bilimsel yayınlar için grafik tabanlı anahtar kelime çıkartma yönetemi

    ABDIRAHMAN MOHAMED ALI

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Ticaret Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. ARZU KAKIŞIM

  4. Türkçe metinlerde denetimli ve sözlük tabanlı duygu analizi yaklaşımlarının karşılaştırılması

    Comparison of supervised and dictionary based sentiment analysis approaches on Turkish text

    BURAK İBRAHİM SEVİNDİ

    Yüksek Lisans

    Türkçe

    Türkçe

    2013

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. HACER KARACAN

  5. State-of-mind classification from unstructured texts using statistical features and lexical network features

    İstatistiksel öznitelikler ve sözcüksel ağ özniteliklerini kullanarak, formatsız metinlerde düşünce yapısı sınıflandırılması

    ULYA BAYRAM

    Doktora

    İngilizce

    İngilizce

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolUniversity of Cincinnati

    Elektrik-Elektronik ve Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. JOHN PESTIAN