Makine öğrenmesi yöntemleriyle kolorektal kanserin moleküler, patolojik, klinik ve prognostik özelliklerinin incelenmesi
Machine learning methods to evaluate molecular, pathological, clinical and prognostic features of colorectal cancer
- Tez No: 957866
- Danışmanlar: PROF. DR. DERYA KARAKOÇ
- Tez Türü: Doktora
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Gastroenteroloji, Onkoloji, Computer Engineering and Computer Science and Control, Gastroenterology, Oncology
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2025
- Dil: Türkçe
- Üniversite: Hacettepe Üniversitesi
- Enstitü: Sağlık Bilimleri Enstitüsü
- Ana Bilim Dalı: Dahili ve Cerrahi Araştırmalar Ana Bilim Dalı
- Bilim Dalı: Temel Cerrahi Araştırmalar Bilim Dalı
- Sayfa Sayısı: 89
Özet
Giriş: Kolorektal kanserin erken tanısı ve bireyselleştirilmiş yönetimi, belirsiz gastrointestinal semptomların tanıda gecikmeye yol açması nedeniyle hâlen önemli bir klinik gereksinimdir. Alana özgü bir transformatör dil modeli (ALLM) ile çoklu ağaç tabanlı algoritmaları birleştirerek KRK taraması, tanısı ve prognozuna yönelik özgün bir ensemble çerçeve geliştirmek ve değerlendirmek. Yöntem: ALLM, 830 serbest metin hasta öyküsünden (330 gerçek, 500 sentetik) yapılandırılmış özellikler çıkarmak üzere ince ayarlandı. Çıkarılan değişkenler iki alt hatta aktarıldı: (i) semptomatik hastalarda kolonoskopi gereksinimini belirleyen bir XGBoost sınıflandırıcısı; (ii) 630 evre II–III KRK olgusunda 24, 36 ve 48 ay genel (OS) ve hastalıksız sağkalımı (DFS) öngören LightGBM, XGBoost, DeepSurv ve DeepHit modelleri. Performans, 10 kat çapraz doğrulama ile değerlendirildi. Bulgular: ALLM, anahtar özellik çıkarımında ortalama F1 skoru 0,92 elde etti. Kolonoskopi sınıflayıcısı AUROC = 0,85 (95 % GA 0,78–0,92) sağladı; albümin, yaş, ferritin ve semptom süresi en etkili değişkenlerdi. Sağkalım tahmininde LightGBM 24, 36 ve 48 ay OS için sırasıyla C-indeks = 0,75; 0,73; 0,71 değerleriyle en iyi performansı sergiledi ve tüm modeller geleneksel yalnız-TNM risk tahminini geride bıraktı. Sonuç: Alana özgü büyük dil modeli temelli özellik çıkarımı ile yorumlanabilir gradyan artırmalı ağaç modellerinin entegrasyonu, erken evre KRK'de daha doğru triyaj ve prognoz öngörüsü için ölçeklenebilir bir yol sunmaktadır. Çok merkezli prospektif çalışmaların yanı sıra görüntüleme ve genomik verilerin dâhil edilmesi, bu modüler çerçevenin geçerliliğini pekiştirecektir.
Özet (Çeviri)
Background: Early identification and individualized management of colorectal cancer (CRC) remain unmet needs, particularly in patients whose vague gastrointestinal symptoms often delay diagnosis. We present and evaluate a proof-of-concept ensemble framework that fuses a gastroenterology-specific transformer language model (“ALLM”) with multiple tree-based algorithms to streamline CRC screening, diagnosis and prognostication. Methods: ALLM was first fine-tuned to extract structured clinical features from 830 free-text histories (330 real, 500 synthetic). Extracted variables fed two downstream pipelines: (i) an XGBoost classifier that flags symptomatic patients who warrant colonoscopy; and (ii) a prognostic suite (LightGBM, XGBoost, DeepSurv, DeepHit) trained on 630 stage II–III CRC cases to predict overall (OS) and disease-free survival (DFS) at 24, 36 and 48 months. Model performance was assessed with 10-fold crossvalidation. Results: ALLM achieved a mean F1-score of 0.92 for key-feature extraction. The colonoscopy classifier reached an AUROC of 0.85 (95 % CI 0.78-0.92), with albumin, age, ferritin and symptom duration as the most influential predictors. For survival prediction, LightGBM consistently out-performed comparators, yielding C-indices of 0.75, 0.73 and 0.71 for OS at 24, 36 and 48 months, respectively, and comparable DFS values. All treebased models surpassed traditional TNM-only risk estimates. Conclusion: Integrating domain-tuned large-language-model feature extraction with interpretable gradient-boosting ensembles offers a scalable route to more accurate triage and outcome prediction in early-stage CRC. Prospective multi-centre studies and incorporation of imaging or genomic inputs are warranted to validate and extend this modular framework.
Benzer Tezler
- Prediction of microsatellite status in colorectal cancer whole slide images using deep neural networks
Derin sinir ağları kullanılarak kolorektal kanser tüm slayt görüntüleri üzerinde mikrosatellit durumu tahmini
FATMA VİLDAN ENGİN
Yüksek Lisans
İngilizce
2025
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
PROF. DR. ENDER METE EKŞİOĞLU
- Estimating metabolic flux variability with machine learning
Metabolik akış değerlerinin makine öğrenmesi ile tahmini
BARIŞ CAN
Yüksek Lisans
İngilizce
2025
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. ALİ ÇAKMAK
- Karaciğer metastazlarında ablasyon sonrası kontrol MRG'de radiomics analizi ile lokal nüks öngörüsü
Prediction of local recurrence using radiomics analysis on post-ablation control MRI in liver metastases
EDANUR KARAPINAR
Tıpta Uzmanlık
Türkçe
2025
Radyoloji ve Nükleer Tıpİstanbul ÜniversitesiRadyodiagnostik Ana Bilim Dalı
DR. ÖĞR. ÜYESİ MEHMET SEMİH ÇAKIR
- Makine öğrenmesi yöntemleriyle meteorolojik parametreler kullanılarak Kapadokya bölgesinde sıcak hava balon uçuşlarının tahmini
Prediction of hot air balloon flights in Cappadocia region using meteorological parameters with machine learning methods
AHMET TÜLEK
Yüksek Lisans
Türkçe
2025
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi ÜniversitesiYönetim Bilişim Sistemleri Ana Bilim Dalı
PROF. DR. HADİ GÖKÇEN
- Makine öğrenmesi yöntemleriyle kredi riski tahmini
Credit risk prediction with machine learning
HAMDİ OKUR
Yüksek Lisans
Türkçe
2020
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. AYDIN ÇETİN