Sağlık alanında yayınlanmış akademik çalışmaların doğal dil işleme ve derin öğrenme yöntemleri ile otomatik özetlenmesi
Automatic summarization of academic studies published in the health field using natural language processing and deep learning methods
- Tez No: 824471
- Danışmanlar: DOÇ. ÇİĞDEM ACI
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2023
- Dil: Türkçe
- Üniversite: Mersin Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
- Sayfa Sayısı: 45
Özet
Sağlık alanında araştırma yapan araştırmacılar için bilimsel yayınları hızlı bir şekilde okumak ve analiz etmek çok önemlidir. Bu anlamda okuyucular genelde tam metin okumak yerine özet kısımları okumayı tercih etmektedir. Otomatik metin özetleme sistemleri insanlara bilgiye daha kısa sürede ulaşma fırsatı sağlamaktadır. Bu alana katkı sağlayan araştırmacılar için, konunun en önemli kısımlarını seçerek, sayfalarca süren yayınları kısa bir boyutta sunan özetler, daha kısa sürede çok daha fazla bilgiye ulaşma olanağı sunduğu için hayati önem arz etmektedir. Bu tez çalışmasında, sağlık alanında yayınlanmış akademik yayınların otomatik özetlenmesi ele alınmıştır. Bilimsel yayınlarda hali hazırda insan tarafından oluşturulmuş özet kısımları mevcuttur, çalışmadaki amaç otomatik özetleme sistemlerinde kullanılan algoritmalar ile genişletilmiş özetler elde edebilmek ve var olan algoritmaları veri kümesine uygulayarak kıyaslama yapmaktır. Bu konuda veri kümesine rastlanmadığı için, özgün bir veri kümesi oluşturulmuştur. Otomatik özetleme sistemlerinde kullanılan yöntemlerden biri olan çıkarıma dayalı özetleme yöntemlerinden, Terim Frekansı, Terim Frekansı ve Ters Belge Frekansı, TextRank, Latent Semantik Analiz ve Gizli Dirichlet Ayrımı, yorumlamaya dayalı özetleme yöntemlerinden ise T5 algoritması ve Üretici Ön-Eğitimli Dönüştürücü algoritmaları olmak üzere toplamda 7 farklı algoritmanın uygulandığı çalışmada, üretilen özetler, orijinal özetlere %76 oranında benzerlik göstererek, insanın oluşturduğu özetlemelere yakın sonuçlar elde edilmiştir. Bu çalışmanın doğal dil işleme alanında Türkçe çalışmalara veri kümesi ve uygulama anlamında katkı sağlanacağı düşünülmektedir.
Özet (Çeviri)
For researchers working in the health field, it is crucial to read and analyze scientific papers quickly. In this regard, readers generally prefer to read summary sections rather than the entire text. Automatic text summarization systems provide researchers with the opportunity to access information in a shorter time. For researchers contributing to this field, the concise summaries that select the most important parts of the topic and present extensive publications in a brief format are of vital importance as they allow accessing a greater amount of information in a shorter period. This thesis focuses on the automatic summarization of academic papers in the health field. Scientific papers already contain manually crafted abstract sections. The aim of this study is to generate expanded summaries using algorithms employed in automatic summarization systems and to compare existing algorithms using a dataset. As there was no available dataset on this subject, an original dataset was created. The study involved the application of seven different algorithms, including extractive summarization methods such as Term Frequency, Term Frequency-Inverse Document Frequency, TextRank, Latent Semantic Analysis, and Latent Dirichlet Allocation, and abstractive summarization methods like the T5 algorithm and Generative Pre-trained Transformer. The generated summaries demonstrated a similarity of 76% to the original summaries, indicating promising results close to human-generated summarizations. It is believed that this study will contribute to Turkish works in the field of natural language processing in terms of dataset and application.
Benzer Tezler
- Билим, илим жана маданият тармагындагы Кыргызстан менен Түркиянын кызматташтыгы (1992-2012 жж.)
Kırgız Cumhuriyeti ile Türkiye Cumhuriyeti arasında eğitim, bilim ve kültürel ilişkiler (1992-2012)
KADRİ AĞGÜN
Doktora
Kırgızca
2016
TarihKyrgyz State University named after I ArabaevTarih Ana Bilim Dalı
PROF. DR. TÖLÖBEK ABDRAHMANOV
- Çevre sağlığı konusunda yapılmış makalelerin bibliyometrik analizi
Bibliometric analysis of the articles which did on environmental health
GÜLAY CENNET ÖZSARI
Yüksek Lisans
Türkçe
2022
BibliyografyaAydın Adnan Menderes ÜniversitesiDisiplinlerarası Çevre Sağlığı Ana Bilim Dalı
DR. ÖĞR. ÜYESİ SEVİL ÖZCAN
- Okula devamsızlık ve okul terki nedenleri: Bir meta-sentez incelemesi
Reasons for school absenteeism and dropout: A meta-synthesis investigation
GÜRKAN ÜNVER
Yüksek Lisans
Türkçe
2022
Eğitim ve Öğretimİstanbul Medeniyet ÜniversitesiEğitim Yönetimi Ana Bilim Dalı
DR. ÖĞR. ÜYESİ SERKAN UÇAN
- Türkiye'de 1992-2022 yılları arasında sağlık turizmi üzerine yapılan çalışmaların bibliyometrik analizi
Bibliometric analysis of studies on health tourism in Turkey between 1992-2022
SADİYE NUR UÇAR
Yüksek Lisans
Türkçe
2024
TurizmSivas Cumhuriyet ÜniversitesiSağlık Turizmi İşletmeciliği Ana Bilim Dalı
DOÇ. DR. ENİS BAHA BİÇER
- Geri bildirim süreçlerinde öğrenme analitikleri: Bibliyometrik bir inceleme
Learning analytics in feedback processes: A bibliometric review
CANSU AYANOĞLU
Yüksek Lisans
Türkçe
2025
Eğitim ve ÖğretimGazi ÜniversitesiBilgisayar ve Öğretim Teknolojileri Eğitimi Ana Bilim Dalı
PROF. DR. SİBEL SOMYÜREK