Makine öğrenimi yöntemleri ile sağkalım analizi
Survival analysis with machine learning methods
- Tez No: 905471
- Danışmanlar: DR. ÖĞR. ÜYESİ AYŞE ÖVGÜ KINAY
- Tez Türü: Yüksek Lisans
- Konular: İstatistik, Statistics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2024
- Dil: Türkçe
- Üniversite: Dokuz Eylül Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: İstatistik Ana Bilim Dalı
- Bilim Dalı: Veri Bilimi Bilim Dalı
- Sayfa Sayısı: 64
Özet
Sağkalım analizi veya olay-zaman analizi, bir dizi gözlemi ele alan ve bu gözlemlerle ilgi duyulan olayın meydana gelmesi için geçen süreyi tahmin etmeye çalışan istatistiksel yöntemlerdir. Sağkalım analiz yöntemleri genel olarak istatistiksel yöntemler ve makine öğrenimine dayalı yöntemler olmak üzere iki kategoriye ayrılmaktadır. Her iki yöntemin de hedefi hayatta kalma süresini tahmin etmek ve hayatta kalma süresi boyunca sağkalım olasılığını tahmin etmektir. Son yıllarda makine öğrenimi yöntemlerinin geleneksel yöntemler ile birleştirilmesi ve optimizasyonundaki gelişmeler, makine öğrenimi yöntemlerinin popülerliğini artırmaktadır. Mekanik sistemlerdeki başarısızlıklar ve özellikle tıp alanında biyolojik organizmalarda sağkalım analizlerinde yaygın olarak kullanılmaktadır. Bu çalışmada üç farklı veri seti makine öğrenimi yöntemlerinden biri olan Rastgele Sağkalım Ormanı (RSO) (Random Survival Forest) algoritması, Ekstra Sağkalım Ağaçları (ESA) (Extra Survival Trees) ve Gradyanla Güçlendirilmiş Modeller (Gradient Boosting Models) ile karşılaştırılmıştır. Kullanılan üç farklı veri setinden birinci veri setinde 859 kayıt, 27 değişken bulunurken, ikinci veri seti 9037 kayıt ile 28 değişkene sahiptir. Üçüncü veri setinde ise 14294 kayıt ile 3 farklı değişken bulunmaktadır. Kullanılan üç farklı veri setiyle, farklı örneklem boyutlarının ve farklı değişken sayılarının her bir algoritma üzerindeki etkileri incelenirken, tahminleme başarıları da ortaya koyulmuştur. Python programlama dili kullanılarak gerçekleştirilen analizler sonucunda bu veri seti için RSO algoritması, ESA algoritmasıyla yaklaşık sonuçlar elde ederken, GGM algoritmasından daha iyi bir performans göstermiştir.
Özet (Çeviri)
Survival analysis or event-time analysis are statistical methods that take a series of observations and try to estimate the time it takes for the event of interest to occur. Survival analysis methods are generally categorized into two groups: statistical methods and machine learning-based methods. The goal of both methods is to estimate the survival time and the probability of survival during the survival time. In recent years, the combination and optimization of machine learning methods with traditional approaches have led to an increase in the popularity of machine learning techniques. It is widely used in failures in mechanical systems and survival analyses in biological organisms, especially in the medical field. In this study, three different datasets were compared using Random Survival Forest (RSF), Extra Survival Trees (EST), and Gradient Boosting Models (GBM), which are among the machine learning methods. The first dataset contains 859 records and 27 variables, while the second dataset consists of 9037 records and 28 variables. The third dataset includes 14294 records with 3 different variables. The study examined the impact of different sample sizes and variable counts on each algorithm and evaluated their prediction accuracies using these three different datasets. The analysis, conducted using the Python programming language, showed that the RSF algorithm achieved similar results to the EST algorithm and performed better than the GBM algorithm for this dataset.
Benzer Tezler
- Machine learning methods for survival data
Sağkalım verileri için makine öğrenmesi yöntemleri
TUĞÇE PAKSOY
Yüksek Lisans
İngilizce
2021
İstatistikDokuz Eylül Üniversitesiİstatistik Ana Bilim Dalı
DOÇ. DR. İDİL YAVUZ
- Design and development of machine learning models for disease prediction and biomarkers detection
Hastalık tahmini ve biyobelirteçlerin tespiti için makine öğrenim modellerinin tasarımı ve geliştirilmesi
MUSTAFA TEMİZ
Doktora
İngilizce
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAbdullah Gül ÜniversitesiElektrik ve Bilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ BURCU GÜNGÖR
PROF. DR. MALİK YOUSEF
- Makine öğrenimi yöntemlerini kullanarak evre III invaziv duktal karsinomlu hasta verilerinin sınıflandırılması
Classification of patients with stage III invasive ductal carcinoma using machine learning methods
EMRE DİRİCAN
Doktora
Türkçe
2019
Bilim ve TeknolojiDicle ÜniversitesiBiyoistatistik Ana Bilim Dalı
PROF. DR. ZEKİ AKKUŞ
- Makine öğrenmesi yöntemleriyle kanser ile ilgili yeni biyobelirteçlerin tespit edilmesi
Identification of novel systems biomarkers for cancer diagnosis using machine learning techniques
FIRAT KURT
Yüksek Lisans
İngilizce
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolMarmara ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. MUSTAFA AĞAOĞLU
PROF. DR. KAZIM YALÇIN ARĞA
- Development of a biomarker panel for the differential diagnosis of muscle-invasive and non-muscle-invasive bladder cancer
Kasa invaziv ve kasa invaziv olmayan mesane kanserinin ayırıcı tanısı için bir biyomarker panelinin geliştirilmesi
ÖZDEN ÖZ
Doktora
İngilizce
2024
GenetikDokuz Eylül ÜniversitesiGenom Bilimleri ve Moleküler Biyoteknoloji Ana Bilim Dalı
PROF. DR. ŞERİF ŞENTÜRK
PROF. DR. MEHMET ÖZTÜRK