Geri Dön

Machine learning based evaluation of scientific retractions

Bilimsel çalışmalardaki geri çekilmelerin makine öğrenimi tabanlı değerlendirilmesi

  1. Tez No: 800434
  2. Yazar: EHTISHAM KIYANI
  3. Danışmanlar: ASST. ASSOC. DR. ÖZLEM FEYZA ERKAN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2022
  8. Dil: İngilizce
  9. Üniversite: BEYKOZ ÜNİVERSİTESİ
  10. Enstitü: Lisansüstü Programlar Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
  13. Sayfa Sayısı: 74

Özet

Araştırmacılar her gün bulgularına dayanarak muazzam sayıda yayın üretmektediler. Bilimsel dergilerde yayınlanan geri çekilmiş makalelerin sıklığı, son 20 yılda, genel yayın sayısındaki kademeli büyümeyi geride bırakarak keskin bir şekilde artmıştır. Yayınların geri çekilmesi, araştırmacının bulgulara ve sonuçlara güvenmesini imkansız kılan ciddi şekilde hatalı veya yanlış bilgi veya veriler içeren makaleler hakkında okuyucuları bilgilendirerek literatürü düzeltmeye yarayan bir mekanizmadır. Şüpheli araştırmalar, özellikle tıp literatüründe, dezenformasyon yayabilir ve insanları tehlikeye atabilir. Mayıs 2020 itibariyle, Geri Çekme İzleme Veritabanı 23.000 geri çekilmiş makaleyi ve bunlardan doğrudan alıntı yapan 800.000 makaleyi göstermektedir. Bu tezde, geri çekilen makalelerle olan ilişkilerine dayanarak hangi yayınların geri çekilmeye yakın olduğunu belirleme ve bunlardan alıntı yapan makalelerin ne zaman yeniden gözden geçirilmesi gerektiği incelenmektedir. Lojistik Regresyon, Naïve Bayes, Destek Karar Makineleri ve Rastgele Orman gibi farklı makine öğrenimi algoritmalarını kullanarak geri çekilme olasılığı yüksek olan makalenin tahmin edilebileceği bir yöntem önerilmiştir. Ayrıca, konu uzmanının yardımıyla alıntı işlevleri için bir ek açıklama şeması sunulmuştur. Bu şemaya göre, 664 makaleden 221'inin yeniden değerlendirilmesi gerektiği belirlenmiştir. Eğitilmiş model, olası geri çekmeleri belirlemede yaklaşık olarak %82 doğruluk elde etmiştir. Böylece, tüm veritabanını gözden geçirmek yerine potansiyel olarak zararlı literatürün bir kısmını kontrol etmek için kaynaklarımızı koruyabiliriz. Sağlık hizmetleri bağlamında, yeni veriler oluşturmak için gelecekteki çalışmalar için birkaç alan ve kategori dikkate alınabilir. Toplanan verilerden daha fazla bilgi ve eğilim keşfedilebilir. Özellik mühendisliği için derin öğrenme modellerinin geliştirilmesi de yararlı olacaktır.

Özet (Çeviri)

Researchers produce a tremendous number of publications based on their findings every single day. The frequency of retracted papers published in scientific journals has sharply increased during the last 20 years, outpacing the gradual growth in the overall number of publications. Retraction is a mechanism for correcting the literature by informing the readers about papers that include information or data that is seriously faulty or inaccurate that makes the researcher impossible to rely on the findings and conclusions. Questionable research may propagate disinformation and put people in danger, particularly in the medical literature. As of May 2020, the Retraction Watch Database shows 23,000 retracted papers and 800,000 articles that directly cite them. In this thesis, we address the problem of determining which publications are close to retraction based on their association with the retracted articles and when we need to reconsider papers that cite them. We proposed a method in which we can predict the paper that is close to retraction using different machine learning algorithms like Logistic Regression, Naïve Bayes, SVM and Random Forest. Moreover, we introduce an annotation scheme for citation functions with the help of a subject matter expert. According to this scheme, we have found that there are 221 papers out of 664 that need reconsideration. The trained model achieved approximately 82% accuracy in identifying possible retractions. In this way, we can save our resources to check some percentage of potentially harmful literature instead of reviewing the complete database. In the context of healthcare, several domains and categories may be taken into consideration for future work to form new data. More insights and trends may be discovered from the collected data. The development of deep learning models for feature engineering would also be useful.

Benzer Tezler

  1. Estimating metabolic flux variability with machine learning

    Metabolik akış değerlerinin makine öğrenmesi ile tahmini

    BARIŞ CAN

    Yüksek Lisans

    İngilizce

    İngilizce

    2025

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ALİ ÇAKMAK

  2. Exploring design based learning activities in 2nd grade science classrooms

    2. sınıf bilim sınıflarında tasarım tabanlı öğrenme aktivitelerinin keşfedilmesi

    ÖZLEM YAPRAK BOSTANCI

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Eğitim ve ÖğretimOrta Doğu Teknik Üniversitesi

    Eğitim Programları ve Öğretimi Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ELİF ÖZTÜRK

  3. Evaluation of the reliability of ChatGPT as a source of scientific information on dental implant surgery

    ChatGPT'nin dental implant cerrahisi konusunda bilimsel bilgi kaynağı olarak güvenilirliğinin değerlendirilmesi

    NEJLA ERTEKİN

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Diş HekimliğiYeditepe Üniversitesi

    Ağız Diş ve Çene Cerrahisi Ana Bilim Dalı

    PROF. DR. CEYDA ÖZÇAKIR TOMRUK

  4. Etkin bina emlak vergi değerinin belirlenebilmesi için makine öğrenme temelli bir değerleme modeli önerisi

    A proposal for a machine learning based valuation model for determining efficient building property tax value

    ELİF ŞEVVAL TAŞTAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2025

    Jeodezi ve Fotogrametriİstanbul Teknik Üniversitesi

    Geomatik Mühendisliği Ana Bilim Dalı

    PROF. DR. REHA METİN ALKAN

  5. Gaziantep'te PM2.5 konsantrasyonunun zamansal ve mekânsaltahminine yönelik transfer öğrenme destekli hibrit yapay zeka modelleri

    Spatio-temporal estimation of PM2.5 concentrations in gaziantepusing transfer learning-based hybrid artificial intelligence models

    TÜRKAN ZENGİN GÖMLEKSİZ

    Yüksek Lisans

    Türkçe

    Türkçe

    2025

    Meteorolojiİstanbul Teknik Üniversitesi

    İklim Bilimi ve Meteoroloji Mühendisliği Ana Bilim Dalı

    PROF. DR. HÜSEYİN TOROS