Geri Dön

Makine öğrenmesi yöntemleriyle kolorektal kanserin moleküler, patolojik, klinik ve prognostik özelliklerinin incelenmesi

Machine learning methods to evaluate molecular, pathological, clinical and prognostic features of colorectal cancer

  1. Tez No: 957866
  2. Yazar: CEM ŞİMŞEK
  3. Danışmanlar: PROF. DR. DERYA KARAKOÇ
  4. Tez Türü: Doktora
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Gastroenteroloji, Onkoloji, Computer Engineering and Computer Science and Control, Gastroenterology, Oncology
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2025
  8. Dil: Türkçe
  9. Üniversite: Hacettepe Üniversitesi
  10. Enstitü: Sağlık Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Dahili ve Cerrahi Araştırmalar Ana Bilim Dalı
  12. Bilim Dalı: Temel Cerrahi Araştırmalar Bilim Dalı
  13. Sayfa Sayısı: 89

Özet

Giriş: Kolorektal kanserin erken tanısı ve bireyselleştirilmiş yönetimi, belirsiz gastrointestinal semptomların tanıda gecikmeye yol açması nedeniyle hâlen önemli bir klinik gereksinimdir. Alana özgü bir transformatör dil modeli (ALLM) ile çoklu ağaç tabanlı algoritmaları birleştirerek KRK taraması, tanısı ve prognozuna yönelik özgün bir ensemble çerçeve geliştirmek ve değerlendirmek. Yöntem: ALLM, 830 serbest metin hasta öyküsünden (330 gerçek, 500 sentetik) yapılandırılmış özellikler çıkarmak üzere ince ayarlandı. Çıkarılan değişkenler iki alt hatta aktarıldı: (i) semptomatik hastalarda kolonoskopi gereksinimini belirleyen bir XGBoost sınıflandırıcısı; (ii) 630 evre II–III KRK olgusunda 24, 36 ve 48 ay genel (OS) ve hastalıksız sağkalımı (DFS) öngören LightGBM, XGBoost, DeepSurv ve DeepHit modelleri. Performans, 10 kat çapraz doğrulama ile değerlendirildi. Bulgular: ALLM, anahtar özellik çıkarımında ortalama F1 skoru 0,92 elde etti. Kolonoskopi sınıflayıcısı AUROC = 0,85 (95 % GA 0,78–0,92) sağladı; albümin, yaş, ferritin ve semptom süresi en etkili değişkenlerdi. Sağkalım tahmininde LightGBM 24, 36 ve 48 ay OS için sırasıyla C-indeks = 0,75; 0,73; 0,71 değerleriyle en iyi performansı sergiledi ve tüm modeller geleneksel yalnız-TNM risk tahminini geride bıraktı. Sonuç: Alana özgü büyük dil modeli temelli özellik çıkarımı ile yorumlanabilir gradyan artırmalı ağaç modellerinin entegrasyonu, erken evre KRK'de daha doğru triyaj ve prognoz öngörüsü için ölçeklenebilir bir yol sunmaktadır. Çok merkezli prospektif çalışmaların yanı sıra görüntüleme ve genomik verilerin dâhil edilmesi, bu modüler çerçevenin geçerliliğini pekiştirecektir.

Özet (Çeviri)

Background: Early identification and individualized management of colorectal cancer (CRC) remain unmet needs, particularly in patients whose vague gastrointestinal symptoms often delay diagnosis. We present and evaluate a proof-of-concept ensemble framework that fuses a gastroenterology-specific transformer language model (“ALLM”) with multiple tree-based algorithms to streamline CRC screening, diagnosis and prognostication. Methods: ALLM was first fine-tuned to extract structured clinical features from 830 free-text histories (330 real, 500 synthetic). Extracted variables fed two downstream pipelines: (i) an XGBoost classifier that flags symptomatic patients who warrant colonoscopy; and (ii) a prognostic suite (LightGBM, XGBoost, DeepSurv, DeepHit) trained on 630 stage II–III CRC cases to predict overall (OS) and disease-free survival (DFS) at 24, 36 and 48 months. Model performance was assessed with 10-fold crossvalidation. Results: ALLM achieved a mean F1-score of 0.92 for key-feature extraction. The colonoscopy classifier reached an AUROC of 0.85 (95 % CI 0.78-0.92), with albumin, age, ferritin and symptom duration as the most influential predictors. For survival prediction, LightGBM consistently out-performed comparators, yielding C-indices of 0.75, 0.73 and 0.71 for OS at 24, 36 and 48 months, respectively, and comparable DFS values. All treebased models surpassed traditional TNM-only risk estimates. Conclusion: Integrating domain-tuned large-language-model feature extraction with interpretable gradient-boosting ensembles offers a scalable route to more accurate triage and outcome prediction in early-stage CRC. Prospective multi-centre studies and incorporation of imaging or genomic inputs are warranted to validate and extend this modular framework.

Benzer Tezler

  1. Prediction of microsatellite status in colorectal cancer whole slide images using deep neural networks

    Derin sinir ağları kullanılarak kolorektal kanser tüm slayt görüntüleri üzerinde mikrosatellit durumu tahmini

    FATMA VİLDAN ENGİN

    Yüksek Lisans

    İngilizce

    İngilizce

    2025

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    PROF. DR. ENDER METE EKŞİOĞLU

  2. Estimating metabolic flux variability with machine learning

    Metabolik akış değerlerinin makine öğrenmesi ile tahmini

    BARIŞ CAN

    Yüksek Lisans

    İngilizce

    İngilizce

    2025

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ALİ ÇAKMAK

  3. Karaciğer metastazlarında ablasyon sonrası kontrol MRG'de radiomics analizi ile lokal nüks öngörüsü

    Prediction of local recurrence using radiomics analysis on post-ablation control MRI in liver metastases

    EDANUR KARAPINAR

    Tıpta Uzmanlık

    Türkçe

    Türkçe

    2025

    Radyoloji ve Nükleer Tıpİstanbul Üniversitesi

    Radyodiagnostik Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ MEHMET SEMİH ÇAKIR

  4. Makine öğrenmesi yöntemleriyle meteorolojik parametreler kullanılarak Kapadokya bölgesinde sıcak hava balon uçuşlarının tahmini

    Prediction of hot air balloon flights in Cappadocia region using meteorological parameters with machine learning methods

    AHMET TÜLEK

    Yüksek Lisans

    Türkçe

    Türkçe

    2025

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi Üniversitesi

    Yönetim Bilişim Sistemleri Ana Bilim Dalı

    PROF. DR. HADİ GÖKÇEN

  5. Makine öğrenmesi yöntemleriyle kredi riski tahmini

    Credit risk prediction with machine learning

    HAMDİ OKUR

    Yüksek Lisans

    Türkçe

    Türkçe

    2020

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. AYDIN ÇETİN