Geri Dön

Sağlık alanında yayınlanmış akademik çalışmaların doğal dil işleme ve derin öğrenme yöntemleri ile otomatik özetlenmesi

Automatic summarization of academic studies published in the health field using natural language processing and deep learning methods

  1. Tez No: 824471
  2. Yazar: ANIL KUŞ
  3. Danışmanlar: DOÇ. ÇİĞDEM ACI
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2023
  8. Dil: Türkçe
  9. Üniversite: Mersin Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
  13. Sayfa Sayısı: 45

Özet

Sağlık alanında araştırma yapan araştırmacılar için bilimsel yayınları hızlı bir şekilde okumak ve analiz etmek çok önemlidir. Bu anlamda okuyucular genelde tam metin okumak yerine özet kısımları okumayı tercih etmektedir. Otomatik metin özetleme sistemleri insanlara bilgiye daha kısa sürede ulaşma fırsatı sağlamaktadır. Bu alana katkı sağlayan araştırmacılar için, konunun en önemli kısımlarını seçerek, sayfalarca süren yayınları kısa bir boyutta sunan özetler, daha kısa sürede çok daha fazla bilgiye ulaşma olanağı sunduğu için hayati önem arz etmektedir. Bu tez çalışmasında, sağlık alanında yayınlanmış akademik yayınların otomatik özetlenmesi ele alınmıştır. Bilimsel yayınlarda hali hazırda insan tarafından oluşturulmuş özet kısımları mevcuttur, çalışmadaki amaç otomatik özetleme sistemlerinde kullanılan algoritmalar ile genişletilmiş özetler elde edebilmek ve var olan algoritmaları veri kümesine uygulayarak kıyaslama yapmaktır. Bu konuda veri kümesine rastlanmadığı için, özgün bir veri kümesi oluşturulmuştur. Otomatik özetleme sistemlerinde kullanılan yöntemlerden biri olan çıkarıma dayalı özetleme yöntemlerinden, Terim Frekansı, Terim Frekansı ve Ters Belge Frekansı, TextRank, Latent Semantik Analiz ve Gizli Dirichlet Ayrımı, yorumlamaya dayalı özetleme yöntemlerinden ise T5 algoritması ve Üretici Ön-Eğitimli Dönüştürücü algoritmaları olmak üzere toplamda 7 farklı algoritmanın uygulandığı çalışmada, üretilen özetler, orijinal özetlere %76 oranında benzerlik göstererek, insanın oluşturduğu özetlemelere yakın sonuçlar elde edilmiştir. Bu çalışmanın doğal dil işleme alanında Türkçe çalışmalara veri kümesi ve uygulama anlamında katkı sağlanacağı düşünülmektedir.

Özet (Çeviri)

For researchers working in the health field, it is crucial to read and analyze scientific papers quickly. In this regard, readers generally prefer to read summary sections rather than the entire text. Automatic text summarization systems provide researchers with the opportunity to access information in a shorter time. For researchers contributing to this field, the concise summaries that select the most important parts of the topic and present extensive publications in a brief format are of vital importance as they allow accessing a greater amount of information in a shorter period. This thesis focuses on the automatic summarization of academic papers in the health field. Scientific papers already contain manually crafted abstract sections. The aim of this study is to generate expanded summaries using algorithms employed in automatic summarization systems and to compare existing algorithms using a dataset. As there was no available dataset on this subject, an original dataset was created. The study involved the application of seven different algorithms, including extractive summarization methods such as Term Frequency, Term Frequency-Inverse Document Frequency, TextRank, Latent Semantic Analysis, and Latent Dirichlet Allocation, and abstractive summarization methods like the T5 algorithm and Generative Pre-trained Transformer. The generated summaries demonstrated a similarity of 76% to the original summaries, indicating promising results close to human-generated summarizations. It is believed that this study will contribute to Turkish works in the field of natural language processing in terms of dataset and application.

Benzer Tezler

  1. Çevre sağlığı konusunda yapılmış makalelerin bibliyometrik analizi

    Bibliometric analysis of the articles which did on environmental health

    GÜLAY CENNET ÖZSARI

    Yüksek Lisans

    Türkçe

    Türkçe

    2022

    BibliyografyaAydın Adnan Menderes Üniversitesi

    Disiplinlerarası Çevre Sağlığı Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ SEVİL ÖZCAN

  2. Okula devamsızlık ve okul terki nedenleri: Bir meta-sentez incelemesi

    Reasons for school absenteeism and dropout: A meta-synthesis investigation

    GÜRKAN ÜNVER

    Yüksek Lisans

    Türkçe

    Türkçe

    2022

    Eğitim ve Öğretimİstanbul Medeniyet Üniversitesi

    Eğitim Yönetimi Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ SERKAN UÇAN

  3. Türkiye'de 1992-2022 yılları arasında sağlık turizmi üzerine yapılan çalışmaların bibliyometrik analizi

    Bibliometric analysis of studies on health tourism in Turkey between 1992-2022

    SADİYE NUR UÇAR

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    TurizmSivas Cumhuriyet Üniversitesi

    Sağlık Turizmi İşletmeciliği Ana Bilim Dalı

    DOÇ. DR. ENİS BAHA BİÇER

  4. Yabancı dil olarak Türkçe öğretiminde sağlık bilimleri kapsamında derlem tabanlı söz varlığı çalışması

    Corpus-based study of vocabulary in health sciences for teaching Turkish as a foreign language

    TUNAHAN DEMİRBAŞ

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    Eğitim ve ÖğretimHacettepe Üniversitesi

    Türkiyat Araştırmaları Ana Bilim Dalı

    PROF. DR. AYTEN GENÇ