Geri Dön

Makine öğrenmesi modelleri kullanarak CRISPR-Cas9 tabanlı gen düzenleme sistemlerinin optimizasyonu

Optimization of CRISPR-Cas9 based genome editing systems using machine learning models

  1. Tez No: 951341
  2. Yazar: ALPEREN TOKGÖZ
  3. Danışmanlar: DOÇ. DR. ÖZAL YILDIRIM
  4. Tez Türü: Yüksek Lisans
  5. Konular: Biyomühendislik, Biyoteknoloji, Mühendislik Bilimleri, Bioengineering, Biotechnology, Engineering Sciences
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2025
  8. Dil: Türkçe
  9. Üniversite: Fırat Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Yazılım Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 64

Özet

Gen düzenleme teknolojilerinin en etkili araçlarından biri olan CRISPR-Cas9 sistemi, biyoteknoloji ve moleküler biyoloji alanında devrim niteliğinde ilerlemelere olanak sağlamıştır. Bu sistemde kullanılacak tek kılavuz RNA'ların (sgRNA) hedef DNA üzerindeki etkinliğini doğru şekilde tahmin etmek, düzenleme verimliliğini doğrudan etkileyen kritik bir faktördür. Bu tez çalışmasının amacı, CRISPR/Cas9 sistemine yönelik olarak sgRNA'ların on-target etkinlik skorlarını (OnTargetScore) makine öğrenmesi yöntemleri ile tahmin etmek ve farklı modellerin performanslarını karşılaştırarak en etkili modeli belirlemektir. Bu kapsamda, Arabidopsis thaliana veri seti üzerinde eğitim yapılmış, XGBoost, LightGBM ve Rastgele Orman olmak üzere üç farklı makine öğrenmesi modeli kullanılmıştır. Modeller, 10 kat çapraz doğrulama yöntemi ile değerlendirilmiş ve RMSE, MAE, R², Pearson ve Spearman korelasyon katsayıları gibi performans metrikleri ile karşılaştırılmıştır. Ayrıca modeller, Solanum lycopersicum (domates) veri seti üzerinde test edilerek doğrulanmıştır. Elde edilen veriler, XGBoost modelinin en başarılı tahmin doğruluğuna sahip olduğunu göstermiştir. LightGBM benzer sonuçlar üretirken, Rastgele Orman modelinin performansı görece daha düşük kalmıştır. Bu tez çalışması, CRISPR araştırmalarında on-target etkinliklerini önceden tahmin edebilecek güvenilir, ölçeklenebilir ve farklı türler arası patternleri çözümleyebilen makine öğrenmesi tabanlı yaklaşımların optimizasyon aracı olarak kullanılabileceğini ortaya koymaktadır.

Özet (Çeviri)

The CRISPR-Cas9 system, one of the most powerful tools in gene editing technologies, has enabled groundbreaking progress in the fields of biotechnology and molecular biology. Accurate prediction of the on-target efficiency of single-guide RNAs (sgRNAs), which are used in this system, is a critical factor directly affecting gene editing performance. The aim of this thesis is to predict sgRNA OnTargetScore values within the CRISPR/Cas9 system using machine learning approaches and to compare the performance of different models in order to determine the most effective one. In this context, three machine learning models XGBoost, LightGBM, and Random Forest were trained using the Arabidopsis thaliana dataset. The models were evaluated using 10-fold cross-validation and compared based on performance metrics including RMSE, MAE, R², Pearson, and Spearman correlation coefficients. Additionally, the generalizability of the models was tested and validated on an independent dataset from Solanum lycopersicum (tomato). The results showed that the XGBoost model achieved the highest predictive accuracy. While LightGBM produced similar outcomes, the Random Forest model performed relatively poorly. This thesis demonstrates that machine learning-based approaches can serve as reliable, scalable, and cross-species adaptable optimization tools for predicting on-target performance in CRISPR research and can reduce experimental workload by identifying efficient sgRNA candidates beforehand.

Benzer Tezler

  1. Stratejik yönetim perspektifinden sigortacılık sektöründe makine öğrenmesi algoritmaları ile anomali tespiti

    An application of machine learning to anomaly detection in insurance industry using strategic management approach

    AYŞE NURBANU ŞAHAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2020

    Endüstri ve Endüstri Mühendisliğiİstanbul Teknik Üniversitesi

    İşletme Mühendisliği Ana Bilim Dalı

    DOÇ. TOLGA KAYA

  2. Yükseköğretim kurumlarındaki öğrenci terkini tahmin etmeye yönelik makine öğrenmesi modellerinin incelenmesi ve açıklanabilirliği

    Analysis and explainability of machine learning models for predicting student dropout in higher education

    ESRA SİLER KARABACAK

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. YUSUF YASLAN

  3. Kariyer planlama için karar destek sistemi

    A decision support system for career recommendation

    MUHAMMET AKGÜN

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    Endüstri ve Endüstri MühendisliğiHacettepe Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    PROF. DR. ÖZLEM MÜGE TESTİK

    DOÇ. DR. OUMOUT CHOUSEINOGLOU

  4. Ontology driven, artificial intelligence based career planning system for individuals

    Bireyler için ontoloji odaklı, yapay zeka tabanlı kariyer planlama sistemi

    BAHADIR AKTAŞ

    Doktora

    İngilizce

    İngilizce

    2024

    Yönetim Bilişim SistemleriSakarya Üniversitesi

    Yönetim Bilişim Sistemleri Ana Bilim Dalı

    DOÇ. DR. ADEM AKBIYIK

    PROF. DR. UTKU KÖSE

  5. High quality computer generated hologram computation and display applications

    Yüksek kaliteli bilgisayar tarafından oluşturulan hologram hesaplama ve görüntüleme uygulamaları

    KORAY KAVAKLI

    Yüksek Lisans

    İngilizce

    İngilizce

    2021

    Elektrik ve Elektronik MühendisliğiKoç Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    PROF. DR. HAKAN ÜREY