Sağlık bilimleri araştırmalarında kullanılan istatistiksel yöntemlerin metin madenciliği ile incelenmesi
Investigation of statistical methods used in health sciences research using text mining
- Tez No: 860790
- Danışmanlar: PROF. DR. BÜLENT ÇELİK
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Biyoistatistik, İstatistik, Computer Engineering and Computer Science and Control, Biostatistics, Statistics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2024
- Dil: Türkçe
- Üniversite: Gazi Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: İstatistik Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 95
Özet
Sağlık bilimlerinde yapılan bilimsel araştırmalar diğer birçok alanda olduğu gibi genellikle örneklem üzerinde yürütülmektedir ve örneklemden elde edilen istatistikler kullanılarak popülasyonun parametrelerine ilişkin çıkarımlar yapılmaktadır. Bu çıkarımlar istatistiksel yöntemler aracılığı ile yapılmaktadır. Araştırmacılar çalışmalarında, kullandıkları istatistiksel yöntemleri“İstatistiksel Analizler”başlığı altında sunmaktadırlar. Çalışmada metin madenciliği yöntemi kullanılarak sağlık bilimleri alanında seçilen ulusal ve uluslararası dergilerde yayınlanmış araştırma makalelerinde kullanılan istatistiksel yöntemler tespit edilmiştir. Sağlık bilimleri alanındaki ulusal dergilerde yayınlanan makaleler için DergiPark platformu ve sağlık bilimleri alanındaki uluslararası dergilerde yayınlanan makaleler için ise PubMed platformu kullanılmıştır. Makale veri setlerine ulaşmak amacıyla DergiPark ve PubMed üzerinden bir robotik süreç otomasyon yazılımı olan UiPath kullanılarak makalelere ait PDF dosyalarına erişilmiş ve kaydedilmiştir. Robota DergiPark'tan“istatistiksel analiz”içeren, 2023 yılına ait sağlık bilimleri dergilerinde yayınlanan makaleler indirtilmiştir. PubMed platformundan ise“statistical analyses”içeren, makale tipi“clinical trial”olan ve 2023 yılına aile sağlık bilimleri dergilerinde yayınlanan makaleler indirtilmiştir. Robot yardımıyla indirilen makalelere ait PDF dosyaları Python kodu yazılarak açılmıştır ve metin koleksiyonu oluşturulmuştur. Kodlama, yazım dili Türkçe ve İngilizce olan metin verileri için ayrı ayrı yapılmıştır. Açılan her makale dosyasındaki harfler küçük harfe dönüştürülmüştür. Kod içerisinde aratılacak olan 72 adet istatistiksel yöntem ve 12 adet programı içeren, yazım dili Türkçe ve İngilizce olan, iki adet PDF dosyası oluşturulmuştur. Oluşturulan dosyalardaki yöntemler ve programlar tüm makalelerde aratılmıştır ve bulunup bulunmamasına göre“1”ve“0”olarak kodlanmıştır. Türkçe ve İngilizce metinlerde kullanılan istatistiksel yöntemlerin sayıları ayrı ayrı toplanarak bir sonuç verisi oluşturulmuştur. Bu sonuca göre ulusal ve uluslararası makalelerde kullanılan istatistiksel yöntemlerin ve programların kullanılma sıklıkları kıyaslanmıştır. Hem ulusal hem uluslararası dergilerde yayınlanan makalelerdeki istatistiksel yöntemler benzerlik göstermiştir. Tek değişkenli analizlerin çok değişkenli analizlere kıyasla oldukça fazla olduğu görülmüştür.
Özet (Çeviri)
Scientific research in health sciences, as in many other fields, is generally conducted on samples, and inferences are made regarding the parameters of the population using statistics obtained from the sample. These inferences are made through statistical methods. Researchers present the statistical methods they use in their studies under the title“Statistical Analyses”. In the study, statistical methods used in research articles published in selected national and international journals in the field of health sciences were determined by using the text mining method. The DergiPark platform was used for articles published in national journals in the field of health sciences, and the PubMed platform was used for articles published in international journals in the field of health sciences. In order to access the article data sets, PDF files of the articles were accessed and saved using UiPath, a robotic process automation software, via DergiPark and PubMed. Articles containing“statistical analysis”and published in health sciences journals dating back to 2023 were downloaded to the robot from DergiPark. Articles containing“statistical analyses”, article type“clinical trial”and published in family health sciences journals in 2023 were downloaded from the PubMed platform. PDF files of the articles downloaded with the help of the robot were opened by writing Python code and a text collection was created. Coding was done separately for text data written in Turkish and English. Letters in each opened article file have been converted to lowercase. Two PDF files, written in Turkish and English, were created, containing 72 statistical methods and 12 programs to be searched in the code. The methods and programs in the created files were searched in all articles and coded as“1”and“0”depending on whether they were found or not. A result data was created by adding the numbers of statistical methods used in Turkish and English texts separately. According to this result, the frequency of use of statistical methods and programs used in national and international articles was compared. Statistical methods in articles published in both national and international journals were similar. It has been observed that univariate analyzes are quite common compared to multivariate analyses.
Benzer Tezler
- Ergenlerin aile ilişkileri ile şiddete yönelimleri arasındaki ilişkide olumsuz ebeveyn tutumu ve aile içi çatışmasının aracılık etkisi
The mediating role of negative parental attitudes and family conflicts between adolescents' family relationships and violence orientations
NURAN KARASAKAL
Yüksek Lisans
Türkçe
2018
İstatistikEskişehir Osmangazi Üniversitesiİstatistik Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ÖZER ÖZAYDIN
- Mikrodizi verilerinde kullanılan farklı normalleştirme yöntemlerinin derin öğrenme performanslarına etkisi
The effect of different normalization methods used in microarray data on DEEP learning performances
ASENA AYÇA ÖZDEMİR
Doktora
Türkçe
2022
BiyoistatistikMersin ÜniversitesiBiyoistatistik ve Tıbbi Bilişim Ana Bilim Dalı
PROF. DR. GÜLHAN TEMEL
PROF. DR. SAİM YOLOĞLU
- Sağlık alanında yapılan araştırmalarda kümeleme algoritmalarının kullanımı: Bir uygulama
Usage of cluster algorithms in health studies: An application
ÖZGE PASİN
Yüksek Lisans
Türkçe
2015
BiyoistatistikDüzce ÜniversitesiBiyoistatistik ve Tıbbi Bilişim Ana Bilim Dalı
PROF. DR. HANDAN ANKARALI
- Estimation of PM10 variations in the Southeastern and Eastern Anatolia regions of Türkiye using remote sensing and statistical models
Türkiye'nin Güneydoğu ve Doğu Anadolu bölgelerindeki PM10 değişimlerinin uzaktan algılama ve ı̇statistiksel modeller kullanılarak tahmini
SULTANAY MURZAEVA
Yüksek Lisans
İngilizce
2024
Bilim ve Teknolojiİstanbul Teknik Üniversitesiİklim ve Deniz Bilimleri Ana Bilim Dalı
PROF. DR. ALPER ÜNAL
- Gruplandırılmış ikili gözlemlerin analizlerinde kullanılan istatistiksel yöntemlerin grupiçi korelasyon düzeylerine göre karşılaştırılması
Comparison of statistical methods for analysis of clustered binary observations according to intraclass correlation levels
ERTUĞRUL ÇOLAK
Doktora
Türkçe
2006
BiyoistatistikEskişehir Osmangazi ÜniversitesiBiyoistatistik Ana Bilim Dalı
PROF. DR. KAZIM ÖZDAMAR