Bilgisayar bilimleri alanında yapılan Türkçe akademik yayınların doğal dil işleme yöntemleri ile incelenmesi
Analysing Turkish academic papers in computer science using natural language processing techniques
- Tez No: 805756
- Danışmanlar: PROF. DR. ECİR UĞUR KÜÇÜKSİLLE
- Tez Türü: Doktora
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2023
- Dil: Türkçe
- Üniversite: Süleyman Demirel Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
- Sayfa Sayısı: 87
Özet
Yayımlandıkları dergilere gönderiminden kabul edilmesine kadar kapsam, biçim ve nitelik bakımından sıkı ve uzun bir süreçten geçen bilimsel makaleler, bu inceleme işlemine rağmen anlatım bütünlüğünü etkileyen durumlar içermektedirler. Bir akademik çalışmanın özetinin içeriğini tam olarak temsil edemeyişi veya olması gereken ana başlıkları içermeyişi çalışmanın anlatımını olumsuz etkileyebilen sebeplerdir ve araştırmacıların çalışmayı hızlı bir şekilde tarayıp kavramasına engel olmaktadırlar. Bununla beraber anlatım bütünlüğüne sahip bir yayının bile okunup anlaşılması zaman almaktayken bütünlüğüne dikkat edilmemiş bir yayının detaylarıyla incelenmesi daha da zorlaşmaktadır. Son yıllarda yapay zeka alanındaki gelişmeler sayesinde yayımlanan bilimsel araştırmaların incelemesini kolaylaştıran araçlar geliştirilmektedir. İnsanlarca konuşulan doğal dillerde yazılan metinlerin, makinelerce anlaşılır hale getirilmesi için çeşitli yöntemler yardımıyla bir dizi işlemden geçirilmesi literatürde doğal dil işleme olarak anılmaktadır. İstatistik ve yapay zeka gibi alanlardan da faydalanan doğal dil işleme, özellikle derin öğrenme yöntemleri ile desteklenerek metin anlamından çıkarsamalar yapabilmek amacıyla kullanılmaktadır. Bu çalışmada, Bilgisayar Bilimleri alanında SCI-EXPANDED, ESCI ve TR Dizin'de indekslenen çeşitli dergilerde Türkçe tam metin olarak yayımlanmış 493 adet araştırma makalesi incelenmiştir. İncelenen makalelerin başlık, özet, anahtar kelimeler ve içerik açısından bütünlüğü; Doğal Dil İşleme, Derin Öğrenme ve istatistiksel yöntemleri de içeren bir dizi ölçüt ile değerlendirilmiştir. Çalışmanın amacı belirlenen ölçütler ile incelenen makalelerin tüm bölümleri ile bütünlüğünü ortaya koymaktır. Değerlendirme bulguları, incelenen makalelerinin biçim ve makale anlatımında bulunması gereken ögeler açısından çarpıcı sonuçlar ortaya koymaktadır. Genel değerlendirme sonucu en yüksek puan alan 84,900 puan ile 358 kayıt numaralı makale, en düşük ise 34,733 puan ile 197 kayıt numaralı makale olmuştur. Özellikle Soyutlayıcı, Çıkarımsal ve BERT özetleme yöntemleri ile yapılan Otomatik Özetleme sonuçlarına göre özetlerin dahil edildiği verisetinde etiketlerin tahmin edilme oranının düştüğü gözlenmiştir. Uzmanlarca etiketlenen özetlerde değerlendirmeye giren 492 makaleden sadece 68 tanesinde tüm ögelere yer verildiği gözlenmiştir. 85 makalede ise ana başlıklardan birinin olmadığı tespit edilmiştir. Sonuç olarak makalelerin büyük bir kısmında özet bölümünün kapsam, problem, amaç, yöntem, bulgu ve sonuca işaret eden anlatımlar açısından kısmen veya büyük oranda yoksun olduğu sonucuna ulaşılmıştır.
Özet (Çeviri)
Scientific articles go through a strict and long process in terms of scope, form, and quality, from their submission to publication. Despite this review process, publications might contain situations that affect the integrity of their meaning. If the abstract of an academic study does not fully represent the content or does not contain standard main headings, that might negatively affect the expression of the study and prevent researchers from scanning and comprehending the study quickly. Nevertheless, while it takes time to read and understand even a publication with narrative integrity, it becomes even more difficult to examine the details of a publication whose integrity has not been taken into account. Tools that make it easier for researchers to review published scientific research have been developed with advances in artificial intelligence in recent years. Enabling machines to understand the texts written in natural languages that are spoken by humans using various methods is called Natural Language Processing (NLP) in the literature. NLP, which benefits from statistics and artificial intelligence fields, especially Deep Learning methods, is a computer science field that is useful for inferring the meaning of text. In this study, 493 full-text Turkish research articles published in various journals indexed in SCI-EXPANDED, ESCI, and TR Index in the field of computer science were examined in terms of abstract, keywords, and content was evaluated with a set of criteria. The aim of the study is to reveal the integrity of all sections of the articles examined with the determined criteria. The data obtained as a result of the study reveal striking results in terms of the format of the articles examined and the elements that should be included in the article abstract. As a result of the general evaluation, the article with the highest score was the article with an ID number of 411 with 84,900 points, and the lowest was the article with an ID number of 239 with 34,733 points. It was observed that the rate of estimation of labels decreased in the dataset that included summaries, especially according to the Automatic Summarization results made with SVM, ANN, and BERT methods. It was observed that, only 68 out of 492 articles have all items in their abstracts, according to the experts. In 85 articles, it was determined that there was no main title. In conclusion, most of the abstract sections of articles are partially or largely lacking in terms of coverage, problem, purpose, method, findings, and conclusion. This evaluation shows that abstract sections of scientific research papers are not effectively written.
Benzer Tezler
- TFEEC : Türkçe finansal olay çıkarım derlemi
TFEEC : Turkish financial event extraction corpus
KADİR ŞİNAS KAYNAK
Yüksek Lisans
Türkçe
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. AHMET CÜNEYD TANTUĞ
- Mevcut betonarme yapıların deprem performanslarının belirlenmesi ve viskoz akışkanlı sönümleyiciler ile güçlendirilmesi için artımsal analize dayalı bir algoritma
An algorithm based on incremental analysis to evaluate performance and retrofit with viscous dampers of existing reinforced conrete structures
YAVUZ DURGUN
Doktora
Türkçe
2013
Deprem Mühendisliğiİstanbul Teknik Üniversitesiİnşaat Mühendisliği Ana Bilim Dalı
PROF. DR. ERKAN ÖZER
- Kaba küme teorisinin literatür tabanlı bilgi keşfine uygulanması
Applying rough set theory to literature based discovery
FATİH MEHMET GÜLEÇ
Doktora
Türkçe
2013
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHacettepe ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. HAYRİ SEVER
- Otizm spektrum bozukluğu olan bireylere yönelik eğitim teknolojisi alanında yapılan çalışmalar: Sistematik bir derleme
Studies on educational technology for individuals with autism spectrum disorders: A systematic review
İREM ASLAN
Yüksek Lisans
Türkçe
2020
Eğitim ve ÖğretimVan Yüzüncü Yıl ÜniversitesiBilgisayar ve Öğretim Teknolojileri Eğitimi Ana Bilim Dalı
DR. ÖĞR. ÜYESİ MUSTAFA SERKAN GÜNBATAR
- Türkiye'nin ulusal siber güvenlik strateji ve politikalarının oluşturulması çerçevesinde caydırıcılık
Deterrence within the framework of creating Turkey's national cybersecurity strategies and policies
MUSTAFA ŞENOL
Doktora
Türkçe
2020
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilişim Uygulamaları Ana Bilim Dalı
PROF. DR. ERTUĞRUL KARAÇUHA