Geri Dön

Machine learning based lay summarization in biomedical domain

Makine öğrenmesi tabanlı tıbbi alanda özetleme sistemi

  1. Tez No: 856282
  2. Yazar: ÇAĞLA ÇOLAK
  3. Danışmanlar: DR. ÖĞR. ÜYESİ AYŞEGÜL TÜYSÜZ ERMAN, DR. ÖĞR. ÜYESİ ZEYNEP İLKNUR KARADENİZ EROL
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2023
  8. Dil: İngilizce
  9. Üniversite: Işık Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 70

Özet

Bilimsel araştırmaları genel kamuoyuna aktarmak, hem hayati bir öneme sahip hem de zorlu bir çaba gerektirmektedir. Bilimsel bilgi ile halkın anlayışı arasındaki boşluğu kapatmak genellikle araştırma bulgularının basitleştirilmiş hali olan özetlerin kullanılmasını gerektirir. Bu tezde, biyomedikal araştırmaların genel kamuoyuna etkili bir şekilde iletilmesini sağlamak amacıyla öz ve ana metinlerden özetler oluşturan bir sistem geliştirmekteyiz. Özellikle PLOS ve eLife gibi önde gelen biyomedikal dergilerden seçilen veri kümelerine dayanarak, öz ve ana metinden özetler oluşturan bir sistem geliştiriyoruz. Bu tez, Biyomedikal Özetleme için iki farklı yaklaşımı keşfeder. Model 1'de, giriş makaleleri, non-ASCII karakterlerin ve gereksiz parantezlerin kaldırılması gibi metin önişleme tekniklerinden geçirilir. BC5CDR ve JNLPBA gibi biyomedikal metinler için özel olarak tasarlanmış adlandırılmış varlık tanıma modelleri olan Stanza kütüphanesi kullanılarak biyo-öznitelikler belirlenir ve etiketlenir. Diğer yandan, Model 2, orijinal özet metnini bir özet olarak kullanır ve önceden işlenmiş tam metin makaleler üzerinde eğitilen BART tabanlı bir model tarafından üretilen özetlerle birleştirir. Modelin 1024 karakterlik giriş uzunluğu sınırlamasını karşılamak için daha uzun makaleler bölümlere ayrılır ve ardışık olarak modele beslenir. Modelin çıktıları birleştirilerek tam bir özet oluşturulur. Oluşturulan özetleri iyileştirmek için metin temizleme ve Stanza kütüphanesinin bilinmeyen kelimeleri belirleme ve etiketleme gibi bir son işleme teknikleri uygulanır. Bu iki yaklaşım, biyomedikal alandaki otomatik özetleme sistemlerinin gelişimine katkıda bulunurken, bilimsel bilginin daha geniş bir kitleye anlaşılır bir şekilde iletilmesini kolaylaştırır.

Özet (Çeviri)

Communicating scientific research to the general public poses both a vital and challenging endeavor. Bridging the gap between scientific knowledge and public understanding often necessitates the use of lay summaries, which offer simplified versions of research findings. In this thesis, we explore the effective communication of biomedical research to the general public by generating concise lay summaries. Drawing upon curated datasets from prominent biomedical journals, namely PLOS and eLife, we develop a system that generates lay summaries from the abstract and main text of research articles. This thesis explores two distinct approaches for Biomedical Lay Summarization. In Model 1, the input articles undergo text preprocessing techniques including the removal of non-ASCII characters and redundant parentheses. The Stanza library is employed to identify and tag bio-entities, utilizing named entity recognition models specifically designed for biomedical text, such as BC5CDR and JNLPBA. Model 2, on the other hand, utilizes the original abstract text as a summary and combines it with summaries generated by a BART-based model trained on preprocessed full-text articles. To accommodate the model's input length limit of 1024 characters, longer articles are divided into sections and fed sequentially into the model. The model's output is then concatenated to form the complete summary. Post-processing techniques, including text cleaning and the use of the Stanza library for unknown word identification and tagging, are applied to refine the generated summaries. These two approaches contribute to the advancement of automatic summarization systems in the biomedical domain, facilitating the comprehension and dissemination of scientific knowledge to a broader audience.

Benzer Tezler

  1. A generalized deep reinforcement learning based controller for heading keeping in waves

    Dalgalı ortamda yön tutma problemi için geliştirilmiş derin takviyeli öğrenme tabanlı bir kontrolcü

    AFŞİN BARAN BAYEZİT

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Gemi ve Deniz Teknoloji Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ÖMER KEMAL KINACI

  2. Ai-powered web application security mechanisms

    Yapay zeka destekli ağ uygulaması güvenliği düzenekleri

    DİLEK YILMAZER DEMİREL

    Doktora

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ MEHMET TAHİR SANDIKKAYA

  3. Normalized least mean square based optimization algorithms for deep learning and their applications

    Derin öğrenme için normalize edilmiş en küçük kareler tabanlı optimizasyon algoritmaları ve uygulamalerı

    ESRA TÜREYEN

    Yüksek Lisans

    İngilizce

    İngilizce

    2025

    Elektrik ve Elektronik Mühendisliğiİhsan Doğramacı Bilkent Üniversitesi

    Elektrik ve Elektronik Mühendisliği Ana Bilim Dalı

    PROF. DR. ÖMER MORGÜL

  4. Koroner arter hastalığının makine öğrenmesi teknikleriyle teşhisi

    Diagnosis of coronary artery disease using machine learning techniques

    ŞÜKRÜ ALKAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2025

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSakarya Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    DOÇ. DR. MUHAMMED KÜRŞAD UÇAR

  5. Depresif bozuklukta intihar davranışını öngörmede ses analizi incelenmesi

    Examination of speech analysis to predict suicidal behavior in depression

    SENA YÜNDEN

    Tıpta Uzmanlık

    Türkçe

    Türkçe

    2024

    PsikiyatriNecmettin Erbakan Üniversitesi

    Ruh Sağlığı ve Hastalıkları Ana Bilim Dalı

    PROF. DR. MEHMET AK