Geri Dön

Sağlık bilimleri araştırmalarında kullanılan istatistiksel yöntemlerin metin madenciliği ile incelenmesi

Investigation of statistical methods used in health sciences research using text mining

  1. Tez No: 860790
  2. Yazar: ÖZEN TAŞTAN
  3. Danışmanlar: PROF. DR. BÜLENT ÇELİK
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Biyoistatistik, İstatistik, Computer Engineering and Computer Science and Control, Biostatistics, Statistics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2024
  8. Dil: Türkçe
  9. Üniversite: Gazi Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: İstatistik Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 95

Özet

Sağlık bilimlerinde yapılan bilimsel araştırmalar diğer birçok alanda olduğu gibi genellikle örneklem üzerinde yürütülmektedir ve örneklemden elde edilen istatistikler kullanılarak popülasyonun parametrelerine ilişkin çıkarımlar yapılmaktadır. Bu çıkarımlar istatistiksel yöntemler aracılığı ile yapılmaktadır. Araştırmacılar çalışmalarında, kullandıkları istatistiksel yöntemleri“İstatistiksel Analizler”başlığı altında sunmaktadırlar. Çalışmada metin madenciliği yöntemi kullanılarak sağlık bilimleri alanında seçilen ulusal ve uluslararası dergilerde yayınlanmış araştırma makalelerinde kullanılan istatistiksel yöntemler tespit edilmiştir. Sağlık bilimleri alanındaki ulusal dergilerde yayınlanan makaleler için DergiPark platformu ve sağlık bilimleri alanındaki uluslararası dergilerde yayınlanan makaleler için ise PubMed platformu kullanılmıştır. Makale veri setlerine ulaşmak amacıyla DergiPark ve PubMed üzerinden bir robotik süreç otomasyon yazılımı olan UiPath kullanılarak makalelere ait PDF dosyalarına erişilmiş ve kaydedilmiştir. Robota DergiPark'tan“istatistiksel analiz”içeren, 2023 yılına ait sağlık bilimleri dergilerinde yayınlanan makaleler indirtilmiştir. PubMed platformundan ise“statistical analyses”içeren, makale tipi“clinical trial”olan ve 2023 yılına aile sağlık bilimleri dergilerinde yayınlanan makaleler indirtilmiştir. Robot yardımıyla indirilen makalelere ait PDF dosyaları Python kodu yazılarak açılmıştır ve metin koleksiyonu oluşturulmuştur. Kodlama, yazım dili Türkçe ve İngilizce olan metin verileri için ayrı ayrı yapılmıştır. Açılan her makale dosyasındaki harfler küçük harfe dönüştürülmüştür. Kod içerisinde aratılacak olan 72 adet istatistiksel yöntem ve 12 adet programı içeren, yazım dili Türkçe ve İngilizce olan, iki adet PDF dosyası oluşturulmuştur. Oluşturulan dosyalardaki yöntemler ve programlar tüm makalelerde aratılmıştır ve bulunup bulunmamasına göre“1”ve“0”olarak kodlanmıştır. Türkçe ve İngilizce metinlerde kullanılan istatistiksel yöntemlerin sayıları ayrı ayrı toplanarak bir sonuç verisi oluşturulmuştur. Bu sonuca göre ulusal ve uluslararası makalelerde kullanılan istatistiksel yöntemlerin ve programların kullanılma sıklıkları kıyaslanmıştır. Hem ulusal hem uluslararası dergilerde yayınlanan makalelerdeki istatistiksel yöntemler benzerlik göstermiştir. Tek değişkenli analizlerin çok değişkenli analizlere kıyasla oldukça fazla olduğu görülmüştür.

Özet (Çeviri)

Scientific research in health sciences, as in many other fields, is generally conducted on samples, and inferences are made regarding the parameters of the population using statistics obtained from the sample. These inferences are made through statistical methods. Researchers present the statistical methods they use in their studies under the title“Statistical Analyses”. In the study, statistical methods used in research articles published in selected national and international journals in the field of health sciences were determined by using the text mining method. The DergiPark platform was used for articles published in national journals in the field of health sciences, and the PubMed platform was used for articles published in international journals in the field of health sciences. In order to access the article data sets, PDF files of the articles were accessed and saved using UiPath, a robotic process automation software, via DergiPark and PubMed. Articles containing“statistical analysis”and published in health sciences journals dating back to 2023 were downloaded to the robot from DergiPark. Articles containing“statistical analyses”, article type“clinical trial”and published in family health sciences journals in 2023 were downloaded from the PubMed platform. PDF files of the articles downloaded with the help of the robot were opened by writing Python code and a text collection was created. Coding was done separately for text data written in Turkish and English. Letters in each opened article file have been converted to lowercase. Two PDF files, written in Turkish and English, were created, containing 72 statistical methods and 12 programs to be searched in the code. The methods and programs in the created files were searched in all articles and coded as“1”and“0”depending on whether they were found or not. A result data was created by adding the numbers of statistical methods used in Turkish and English texts separately. According to this result, the frequency of use of statistical methods and programs used in national and international articles was compared. Statistical methods in articles published in both national and international journals were similar. It has been observed that univariate analyzes are quite common compared to multivariate analyses.

Benzer Tezler

  1. Ergenlerin aile ilişkileri ile şiddete yönelimleri arasındaki ilişkide olumsuz ebeveyn tutumu ve aile içi çatışmasının aracılık etkisi

    The mediating role of negative parental attitudes and family conflicts between adolescents' family relationships and violence orientations

    NURAN KARASAKAL

    Yüksek Lisans

    Türkçe

    Türkçe

    2018

    İstatistikEskişehir Osmangazi Üniversitesi

    İstatistik Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ÖZER ÖZAYDIN

  2. Mikrodizi verilerinde kullanılan farklı normalleştirme yöntemlerinin derin öğrenme performanslarına etkisi

    The effect of different normalization methods used in microarray data on DEEP learning performances

    ASENA AYÇA ÖZDEMİR

    Doktora

    Türkçe

    Türkçe

    2022

    BiyoistatistikMersin Üniversitesi

    Biyoistatistik ve Tıbbi Bilişim Ana Bilim Dalı

    PROF. DR. GÜLHAN TEMEL

    PROF. DR. SAİM YOLOĞLU

  3. Sağlık alanında yapılan araştırmalarda kümeleme algoritmalarının kullanımı: Bir uygulama

    Usage of cluster algorithms in health studies: An application

    ÖZGE PASİN

    Yüksek Lisans

    Türkçe

    Türkçe

    2015

    BiyoistatistikDüzce Üniversitesi

    Biyoistatistik ve Tıbbi Bilişim Ana Bilim Dalı

    PROF. DR. HANDAN ANKARALI

  4. Estimation of PM10 variations in the Southeastern and Eastern Anatolia regions of Türkiye using remote sensing and statistical models

    Türkiye'nin Güneydoğu ve Doğu Anadolu bölgelerindeki PM10 değişimlerinin uzaktan algılama ve ı̇statistiksel modeller kullanılarak tahmini

    SULTANAY MURZAEVA

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Bilim ve Teknolojiİstanbul Teknik Üniversitesi

    İklim ve Deniz Bilimleri Ana Bilim Dalı

    PROF. DR. ALPER ÜNAL

  5. Gruplandırılmış ikili gözlemlerin analizlerinde kullanılan istatistiksel yöntemlerin grupiçi korelasyon düzeylerine göre karşılaştırılması

    Comparison of statistical methods for analysis of clustered binary observations according to intraclass correlation levels

    ERTUĞRUL ÇOLAK

    Doktora

    Türkçe

    Türkçe

    2006

    BiyoistatistikEskişehir Osmangazi Üniversitesi

    Biyoistatistik Ana Bilim Dalı

    PROF. DR. KAZIM ÖZDAMAR