Machine learning based approach for text summarization
Metin özetlemesi için makine öğrenmesi tabanlı yaklaşım
- Tez No: 878177
- Danışmanlar: YRD. DOÇ. DR. ABDULLAHİ ABDU IBRAHIM
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2023
- Dil: İngilizce
- Üniversite: Altınbaş Üniversitesi
- Enstitü: Lisansüstü Eğitim Enstitüsü
- Ana Bilim Dalı: Bilgi Teknolojileri Ana Bilim Dalı
- Bilim Dalı: Bilgi Teknolojileri Bilim Dalı
- Sayfa Sayısı: 64
Özet
Modern dijital çağda, metinsel verilerin bolluğu hem zorluklara hem de fırsatlara yol açmıştır. Bu araştırma, Kupiec'in temel çerçevesini temel alan bir makine öğrenimi yaklaşımı kullanarak eğitilebilir metin özetleyicileri geliştirmeyi amaçlayarak metin özetlemenin inceliklerini araştırıyor. Titiz deneyler yoluyla, otomatik olarak oluşturulan özetleri manuel olarak hazırlanmış özetlerle karşılaştırarak önemli bulgulara ışık tuttuk. Araştırmalarımız, geleneksel yöntemleri sürekli olarak aşan Naive Bayes sınıflandırıcısını kullanan eğitilebilir yöntemin önemini ortaya çıkardı. Ayrıca sınıflandırıcının özellikle Naive Bayes ile C4.5 karar ağacı arasından yaptığı seçim, özetleyicinin performansında belirleyici bir faktör olarak ortaya çıktı. Yalnızca sonuçları ölçmenin ötesinde, araştırmamızın daha derin sonuçları, gelişmiş sinir ağlarıyla potansiyel entegrasyonlara, özellikle de derin öğrenmenin gelişmiş analitik yeteneklerinden yararlanmanın ümit verici beklentilerine işaret etti. Önümüzdeki dönem muhtemelen anlamsal özetlemeyi vurgulayacak, bağlamın önemini, çok dilli yeterliliği ve sözdizimsel kısalık ile özün korunması arasındaki hassas dengeyi savunacaktır. Ufuk tasavvur eden kişiselleştirilmiş özetleme, bir sonraki sınır olarak ortaya çıkıyor ve özetlerin uyarlanabilir bir geri bildirim mekanizmasıyla desteklenen bireysel yankıları yansıttığı bir alanı ima ediyor. Dijital alan gerçek zamanlı dinamizmle güçlendikçe, özetleme araçlarımız da bu evrime paralel olmalı ve geniş Nesnelerin İnterneti (IoT) ile potansiyel entegrasyona işaret etmelidir. Bu teknik atılımların ortasında etik hususlar hâlâ en önemli konu olmaya devam ediyor. Önyargılardan ve artırılmış şeffaflıktan arındırılmış tarafsız özetleme, araştırmanın yol gösterici yıldızı haline gelir. Özünde bu araştırma, günümüzün hızlanan bilgi çağında metin özetlemenin hayati rolünü vurgulamaktadır. Teknolojik atılımları etik dayanaklara kadar kapsayan kapsayıcı bir bakış açısının benimsenmesi, kısa ve öz, ilişkilendirilebilir ve sorumlu bilgi sentezinin geleceğini şekillendirecektir.
Özet (Çeviri)
In the modern digital era, the abundance of textual data has opened both challenges and opportunities. This research delves into the nuances of text summarization, aiming to develop trainable text summarizers using a machine learning approach, building on Kupiec's foundational framework. Through rigorous experimentation, we contrasted automatically produced summaries against those manually crafted, shedding light on pivotal findings. Our investigations revealed the prominence of the trainable method deploying the Naive Bayes classifier, which consistently surpassed traditional methods. Additionally, the classifier's selection, particularly between Naive Bayes and the C4.5 decision tree, emerged as a determinative factor in the summarizer's performance. Beyond merely quantifying outcomes, the deeper implications of our research pointed towards potential integrations with advanced neural networks, especially the tantalizing prospects of leveraging deep learning's sophisticated analytical capabilities. The forthcoming era is likely to emphasize semantic summarization, championing the importance of context, multi-lingual proficiency, and the delicate balance between syntactical brevity and essence preservation. Envisioning the horizon, personalized summarization emerges as the next frontier, alluding to a realm where summaries echo individual resonances, underpinned by an adaptive feedback mechanism. As the digital realm amplifies in real-time dynamism, our summarization tools must parallel this evolution, signifying potential integration with the expansive Internet of Things (IoT). Amidst these technical strides, ethical considerations remain paramount. Neutral summarization, devoid of biases and augmented transparency, becomes the research's guiding star. In essence, this research emphasizes the crucial role of text summarization in today's accelerating information age. Adopting an encompassing perspective, spanning technological breakthroughs to ethical anchors, will sculpt the future of succinct, relatable, and responsible information synthesis.
Benzer Tezler
- Automated query-biased and structure-preserving document summarization for web search tasks
Arama motorları için bilgi isteğine ve metin yapısına dayalı olarak otomatik doküman özetlenmesi
FATMA CANAN PEMBE
Doktora
İngilizce
2010
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. TUNGA GÜNGÖR
- Learning logic rules from text using statistical methods for natural language processing
İstatistiksel yöntemler kullanarak doğal dil işleme amacıyla mantıksal kural öğrenmesi
MISHAL KAZMI
Doktora
İngilizce
2017
Elektrik ve Elektronik MühendisliğiSabancı ÜniversitesiElektrik Mühendisliği Ana Bilim Dalı
PROF. DR. YÜCEL SAYGIN
YRD. DOÇ. DR. PETER SCHÜLLER
- Graph-based keyword extraction method for scientific publications
Bilimsel yayınlar için grafik tabanlı anahtar kelime çıkartma yönetemi
ABDIRAHMAN MOHAMED ALI
Yüksek Lisans
İngilizce
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Ticaret ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. ARZU KAKIŞIM
- Türkçe metinlerde denetimli ve sözlük tabanlı duygu analizi yaklaşımlarının karşılaştırılması
Comparison of supervised and dictionary based sentiment analysis approaches on Turkish text
BURAK İBRAHİM SEVİNDİ
Yüksek Lisans
Türkçe
2013
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. HACER KARACAN
- State-of-mind classification from unstructured texts using statistical features and lexical network features
İstatistiksel öznitelikler ve sözcüksel ağ özniteliklerini kullanarak, formatsız metinlerde düşünce yapısı sınıflandırılması
ULYA BAYRAM
Doktora
İngilizce
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolUniversity of CincinnatiElektrik-Elektronik ve Bilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. JOHN PESTIAN