Makine öğrenimi yöntemleri ile sağkalım analizi
Survival analysis with machine learning methods
- Tez No: 905471
- Danışmanlar: DR. ÖĞR. ÜYESİ AYŞE ÖVGÜ KINAY
- Tez Türü: Yüksek Lisans
- Konular: İstatistik, Statistics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2024
- Dil: Türkçe
- Üniversite: Dokuz Eylül Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: İstatistik Ana Bilim Dalı
- Bilim Dalı: Veri Bilimi Bilim Dalı
- Sayfa Sayısı: 64
Özet
Sağkalım analizi veya olay-zaman analizi, bir dizi gözlemi ele alan ve bu gözlemlerle ilgi duyulan olayın meydana gelmesi için geçen süreyi tahmin etmeye çalışan istatistiksel yöntemlerdir. Sağkalım analiz yöntemleri genel olarak istatistiksel yöntemler ve makine öğrenimine dayalı yöntemler olmak üzere iki kategoriye ayrılmaktadır. Her iki yöntemin de hedefi hayatta kalma süresini tahmin etmek ve hayatta kalma süresi boyunca sağkalım olasılığını tahmin etmektir. Son yıllarda makine öğrenimi yöntemlerinin geleneksel yöntemler ile birleştirilmesi ve optimizasyonundaki gelişmeler, makine öğrenimi yöntemlerinin popülerliğini artırmaktadır. Mekanik sistemlerdeki başarısızlıklar ve özellikle tıp alanında biyolojik organizmalarda sağkalım analizlerinde yaygın olarak kullanılmaktadır. Bu çalışmada üç farklı veri seti makine öğrenimi yöntemlerinden biri olan Rastgele Sağkalım Ormanı (RSO) (Random Survival Forest) algoritması, Ekstra Sağkalım Ağaçları (ESA) (Extra Survival Trees) ve Gradyanla Güçlendirilmiş Modeller (Gradient Boosting Models) ile karşılaştırılmıştır. Kullanılan üç farklı veri setinden birinci veri setinde 859 kayıt, 27 değişken bulunurken, ikinci veri seti 9037 kayıt ile 28 değişkene sahiptir. Üçüncü veri setinde ise 14294 kayıt ile 3 farklı değişken bulunmaktadır. Kullanılan üç farklı veri setiyle, farklı örneklem boyutlarının ve farklı değişken sayılarının her bir algoritma üzerindeki etkileri incelenirken, tahminleme başarıları da ortaya koyulmuştur. Python programlama dili kullanılarak gerçekleştirilen analizler sonucunda bu veri seti için RSO algoritması, ESA algoritmasıyla yaklaşık sonuçlar elde ederken, GGM algoritmasından daha iyi bir performans göstermiştir.
Özet (Çeviri)
Survival analysis or event-time analysis are statistical methods that take a series of observations and try to estimate the time it takes for the event of interest to occur. Survival analysis methods are generally categorized into two groups: statistical methods and machine learning-based methods. The goal of both methods is to estimate the survival time and the probability of survival during the survival time. In recent years, the combination and optimization of machine learning methods with traditional approaches have led to an increase in the popularity of machine learning techniques. It is widely used in failures in mechanical systems and survival analyses in biological organisms, especially in the medical field. In this study, three different datasets were compared using Random Survival Forest (RSF), Extra Survival Trees (EST), and Gradient Boosting Models (GBM), which are among the machine learning methods. The first dataset contains 859 records and 27 variables, while the second dataset consists of 9037 records and 28 variables. The third dataset includes 14294 records with 3 different variables. The study examined the impact of different sample sizes and variable counts on each algorithm and evaluated their prediction accuracies using these three different datasets. The analysis, conducted using the Python programming language, showed that the RSF algorithm achieved similar results to the EST algorithm and performed better than the GBM algorithm for this dataset.
Benzer Tezler
- Machine learning and systems biology-based approaches for identification of key biomolecules in liver diseases
Karaciğer hastalıklarında anahtar biyomoleküllerin tanımlanması için makine öğrenmesi ve sistem biyolojisi temelli yaklaşımlar
BETÜL CÖMERTPAY
Doktora
İngilizce
2025
BiyomühendislikAdana Alparslan Türkeş Bilim Ve Teknoloji ÜniversitesiBiyomühendislik Ana Bilim Dalı
DOÇ. DR. ESRA GÖV
- Machine learning methods for survival data
Sağkalım verileri için makine öğrenmesi yöntemleri
TUĞÇE PAKSOY
Yüksek Lisans
İngilizce
2021
İstatistikDokuz Eylül Üniversitesiİstatistik Ana Bilim Dalı
DOÇ. DR. İDİL YAVUZ
- Survival modeling in cutaneous melanoma via integrative transcriptomic and epigenetic bioinformatics
Kutanöz melanomda transkriptomik ve epigenetik biyoinformatik entegrasyonu ile sağkalım modellemesi
SUMAILA ABUBAKARI
Doktora
İngilizce
2025
BiyoistatistikYıldız Teknik Üniversitesiİstatistik Ana Bilim Dalı
PROF. DR. FİLİZ KARAMAN
- Design and development of machine learning models for disease prediction and biomarkers detection
Hastalık tahmini ve biyobelirteçlerin tespiti için makine öğrenim modellerinin tasarımı ve geliştirilmesi
MUSTAFA TEMİZ
Doktora
İngilizce
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAbdullah Gül ÜniversitesiElektrik ve Bilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ BURCU GÜNGÖR
PROF. DR. MALİK YOUSEF
- Makine öğrenimi yöntemlerini kullanarak evre III invaziv duktal karsinomlu hasta verilerinin sınıflandırılması
Classification of patients with stage III invasive ductal carcinoma using machine learning methods
EMRE DİRİCAN
Doktora
Türkçe
2019
Bilim ve TeknolojiDicle ÜniversitesiBiyoistatistik Ana Bilim Dalı
PROF. DR. ZEKİ AKKUŞ