Makine öğrenmesi modelleri kullanarak CRISPR-Cas9 tabanlı gen düzenleme sistemlerinin optimizasyonu
Optimization of CRISPR-Cas9 based genome editing systems using machine learning models
- Tez No: 951341
- Danışmanlar: DOÇ. DR. ÖZAL YILDIRIM
- Tez Türü: Yüksek Lisans
- Konular: Biyomühendislik, Biyoteknoloji, Mühendislik Bilimleri, Bioengineering, Biotechnology, Engineering Sciences
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2025
- Dil: Türkçe
- Üniversite: Fırat Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Yazılım Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 64
Özet
Gen düzenleme teknolojilerinin en etkili araçlarından biri olan CRISPR-Cas9 sistemi, biyoteknoloji ve moleküler biyoloji alanında devrim niteliğinde ilerlemelere olanak sağlamıştır. Bu sistemde kullanılacak tek kılavuz RNA'ların (sgRNA) hedef DNA üzerindeki etkinliğini doğru şekilde tahmin etmek, düzenleme verimliliğini doğrudan etkileyen kritik bir faktördür. Bu tez çalışmasının amacı, CRISPR/Cas9 sistemine yönelik olarak sgRNA'ların on-target etkinlik skorlarını (OnTargetScore) makine öğrenmesi yöntemleri ile tahmin etmek ve farklı modellerin performanslarını karşılaştırarak en etkili modeli belirlemektir. Bu kapsamda, Arabidopsis thaliana veri seti üzerinde eğitim yapılmış, XGBoost, LightGBM ve Rastgele Orman olmak üzere üç farklı makine öğrenmesi modeli kullanılmıştır. Modeller, 10 kat çapraz doğrulama yöntemi ile değerlendirilmiş ve RMSE, MAE, R², Pearson ve Spearman korelasyon katsayıları gibi performans metrikleri ile karşılaştırılmıştır. Ayrıca modeller, Solanum lycopersicum (domates) veri seti üzerinde test edilerek doğrulanmıştır. Elde edilen veriler, XGBoost modelinin en başarılı tahmin doğruluğuna sahip olduğunu göstermiştir. LightGBM benzer sonuçlar üretirken, Rastgele Orman modelinin performansı görece daha düşük kalmıştır. Bu tez çalışması, CRISPR araştırmalarında on-target etkinliklerini önceden tahmin edebilecek güvenilir, ölçeklenebilir ve farklı türler arası patternleri çözümleyebilen makine öğrenmesi tabanlı yaklaşımların optimizasyon aracı olarak kullanılabileceğini ortaya koymaktadır.
Özet (Çeviri)
The CRISPR-Cas9 system, one of the most powerful tools in gene editing technologies, has enabled groundbreaking progress in the fields of biotechnology and molecular biology. Accurate prediction of the on-target efficiency of single-guide RNAs (sgRNAs), which are used in this system, is a critical factor directly affecting gene editing performance. The aim of this thesis is to predict sgRNA OnTargetScore values within the CRISPR/Cas9 system using machine learning approaches and to compare the performance of different models in order to determine the most effective one. In this context, three machine learning models XGBoost, LightGBM, and Random Forest were trained using the Arabidopsis thaliana dataset. The models were evaluated using 10-fold cross-validation and compared based on performance metrics including RMSE, MAE, R², Pearson, and Spearman correlation coefficients. Additionally, the generalizability of the models was tested and validated on an independent dataset from Solanum lycopersicum (tomato). The results showed that the XGBoost model achieved the highest predictive accuracy. While LightGBM produced similar outcomes, the Random Forest model performed relatively poorly. This thesis demonstrates that machine learning-based approaches can serve as reliable, scalable, and cross-species adaptable optimization tools for predicting on-target performance in CRISPR research and can reduce experimental workload by identifying efficient sgRNA candidates beforehand.
Benzer Tezler
- Stratejik yönetim perspektifinden sigortacılık sektöründe makine öğrenmesi algoritmaları ile anomali tespiti
An application of machine learning to anomaly detection in insurance industry using strategic management approach
AYŞE NURBANU ŞAHAN
Yüksek Lisans
Türkçe
2020
Endüstri ve Endüstri Mühendisliğiİstanbul Teknik Üniversitesiİşletme Mühendisliği Ana Bilim Dalı
DOÇ. TOLGA KAYA
- Yükseköğretim kurumlarındaki öğrenci terkini tahmin etmeye yönelik makine öğrenmesi modellerinin incelenmesi ve açıklanabilirliği
Analysis and explainability of machine learning models for predicting student dropout in higher education
ESRA SİLER KARABACAK
Yüksek Lisans
Türkçe
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. YUSUF YASLAN
- Kariyer planlama için karar destek sistemi
A decision support system for career recommendation
MUHAMMET AKGÜN
Yüksek Lisans
Türkçe
2019
Endüstri ve Endüstri MühendisliğiHacettepe ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
PROF. DR. ÖZLEM MÜGE TESTİK
DOÇ. DR. OUMOUT CHOUSEINOGLOU
- Ontology driven, artificial intelligence based career planning system for individuals
Bireyler için ontoloji odaklı, yapay zeka tabanlı kariyer planlama sistemi
BAHADIR AKTAŞ
Doktora
İngilizce
2024
Yönetim Bilişim SistemleriSakarya ÜniversitesiYönetim Bilişim Sistemleri Ana Bilim Dalı
DOÇ. DR. ADEM AKBIYIK
PROF. DR. UTKU KÖSE
- High quality computer generated hologram computation and display applications
Yüksek kaliteli bilgisayar tarafından oluşturulan hologram hesaplama ve görüntüleme uygulamaları
KORAY KAVAKLI
Yüksek Lisans
İngilizce
2021
Elektrik ve Elektronik MühendisliğiKoç ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
PROF. DR. HAKAN ÜREY