Machine learning based evaluation of scientific retractions
Bilimsel çalışmalardaki geri çekilmelerin makine öğrenimi tabanlı değerlendirilmesi
- Tez No: 800434
- Danışmanlar: ASST. ASSOC. DR. ÖZLEM FEYZA ERKAN
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2022
- Dil: İngilizce
- Üniversite: BEYKOZ ÜNİVERSİTESİ
- Enstitü: Lisansüstü Programlar Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
- Sayfa Sayısı: 74
Özet
Araştırmacılar her gün bulgularına dayanarak muazzam sayıda yayın üretmektediler. Bilimsel dergilerde yayınlanan geri çekilmiş makalelerin sıklığı, son 20 yılda, genel yayın sayısındaki kademeli büyümeyi geride bırakarak keskin bir şekilde artmıştır. Yayınların geri çekilmesi, araştırmacının bulgulara ve sonuçlara güvenmesini imkansız kılan ciddi şekilde hatalı veya yanlış bilgi veya veriler içeren makaleler hakkında okuyucuları bilgilendirerek literatürü düzeltmeye yarayan bir mekanizmadır. Şüpheli araştırmalar, özellikle tıp literatüründe, dezenformasyon yayabilir ve insanları tehlikeye atabilir. Mayıs 2020 itibariyle, Geri Çekme İzleme Veritabanı 23.000 geri çekilmiş makaleyi ve bunlardan doğrudan alıntı yapan 800.000 makaleyi göstermektedir. Bu tezde, geri çekilen makalelerle olan ilişkilerine dayanarak hangi yayınların geri çekilmeye yakın olduğunu belirleme ve bunlardan alıntı yapan makalelerin ne zaman yeniden gözden geçirilmesi gerektiği incelenmektedir. Lojistik Regresyon, Naïve Bayes, Destek Karar Makineleri ve Rastgele Orman gibi farklı makine öğrenimi algoritmalarını kullanarak geri çekilme olasılığı yüksek olan makalenin tahmin edilebileceği bir yöntem önerilmiştir. Ayrıca, konu uzmanının yardımıyla alıntı işlevleri için bir ek açıklama şeması sunulmuştur. Bu şemaya göre, 664 makaleden 221'inin yeniden değerlendirilmesi gerektiği belirlenmiştir. Eğitilmiş model, olası geri çekmeleri belirlemede yaklaşık olarak %82 doğruluk elde etmiştir. Böylece, tüm veritabanını gözden geçirmek yerine potansiyel olarak zararlı literatürün bir kısmını kontrol etmek için kaynaklarımızı koruyabiliriz. Sağlık hizmetleri bağlamında, yeni veriler oluşturmak için gelecekteki çalışmalar için birkaç alan ve kategori dikkate alınabilir. Toplanan verilerden daha fazla bilgi ve eğilim keşfedilebilir. Özellik mühendisliği için derin öğrenme modellerinin geliştirilmesi de yararlı olacaktır.
Özet (Çeviri)
Researchers produce a tremendous number of publications based on their findings every single day. The frequency of retracted papers published in scientific journals has sharply increased during the last 20 years, outpacing the gradual growth in the overall number of publications. Retraction is a mechanism for correcting the literature by informing the readers about papers that include information or data that is seriously faulty or inaccurate that makes the researcher impossible to rely on the findings and conclusions. Questionable research may propagate disinformation and put people in danger, particularly in the medical literature. As of May 2020, the Retraction Watch Database shows 23,000 retracted papers and 800,000 articles that directly cite them. In this thesis, we address the problem of determining which publications are close to retraction based on their association with the retracted articles and when we need to reconsider papers that cite them. We proposed a method in which we can predict the paper that is close to retraction using different machine learning algorithms like Logistic Regression, Naïve Bayes, SVM and Random Forest. Moreover, we introduce an annotation scheme for citation functions with the help of a subject matter expert. According to this scheme, we have found that there are 221 papers out of 664 that need reconsideration. The trained model achieved approximately 82% accuracy in identifying possible retractions. In this way, we can save our resources to check some percentage of potentially harmful literature instead of reviewing the complete database. In the context of healthcare, several domains and categories may be taken into consideration for future work to form new data. More insights and trends may be discovered from the collected data. The development of deep learning models for feature engineering would also be useful.
Benzer Tezler
- Evaluation of the reliability of ChatGPT as a source of scientific information on dental implant surgery
ChatGPT'nin dental implant cerrahisi konusunda bilimsel bilgi kaynağı olarak güvenilirliğinin değerlendirilmesi
NEJLA ERTEKİN
Yüksek Lisans
İngilizce
2024
Diş HekimliğiYeditepe ÜniversitesiAğız Diş ve Çene Cerrahisi Ana Bilim Dalı
PROF. DR. CEYDA ÖZÇAKIR TOMRUK
- Platform and data-aware execution of sparse triangular solve on CPU-GPU heterogeneous systems
Başlık çevirisi yok
NAJEEB AHMAD
Doktora
İngilizce
2021
Mühendislik BilimleriKoç ÜniversitesiBilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ DİDEM UNAT ERTEN
- Yapay zekâ teknolojilerinin ceza muhakemesinde kişisel veri toplanmasına etkileri
The impact of artificial intelligence technologies on personal data collection within criminal procedures
IRMAK ERDOĞAN
- İmalat sistemlerinin tasarlanması ve öncelik kurallarının belirlenmesinde yapay sinir ağlarının kullanılması
Başlık çevirisi yok
TARIK ÇAKAR
Doktora
Türkçe
1997
Mühendislik Bilimleriİstanbul Teknik Üniversitesiİşletme Mühendisliği Ana Bilim Dalı
PROF. DR. AYHAN TORAMAN
- Transform based artificial intelligent review of scientific papers
Bilimsel makalelerin dönüşüm tabanlı yapay zeka ile değerlendirilmesi
UĞUR BAKAY
Yüksek Lisans
İngilizce
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolYaşar ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ KAZIM ERDOĞDU
PROF. DR. CÜNEYT GÜZELİŞ