Geri Dön

Kopya sayısı varyasyonlarının makine öğrenme yöntemi ile analiz edilmesi

Analysis of copy number variations with machine learning technics

  1. Tez No: 608275
  2. Yazar: ERHAN PARILTAY
  3. Danışmanlar: DOÇ. DR. BUKET KOSOVA
  4. Tez Türü: Doktora
  5. Konular: Bilim ve Teknoloji, Genetik, Science and Technology, Genetics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2019
  8. Dil: Türkçe
  9. Üniversite: Ege Üniversitesi
  10. Enstitü: Sağlık Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Sağlık Biyoinformatiği Ana Bilim Dalı
  12. Bilim Dalı: Sağlık Biyoinformatiği Bilim Dalı
  13. Sayfa Sayısı: 69

Özet

Kopya sayısı varyasyonları insan genomunun yaklaşık yüzde ikisinde bulunan belirli bir DNA bölgesinin kayıp veya kazançlarıdır. Yapısal varyasyonlar arasında yer alan bu grup sağlıklı popülasyonda bulunabileceği gibi ilgili bölgenin kayıp veya kazançları klinik tablolarla ilişkilendirilebilir. Tespit edilen kopya sayısı varyasyonunun klinik olarak yorumlamak aile çalışmasını da gerektiren, klinik ve genetik verinin değerlendirme sürecidir ve her zaman doğru bilgiye ulaşılamamaktadır. Kullanımı artan makine öğrenme algoritmaları tıp alanında da kullanılmakta ve özellikle büyük veri setlerinin bulunduğu genetik gibi alanlarda giderek önem kazanmaktadır. Bu çalışma ile kopya sayısı varyasyonlarının klinik açıdan değerlendirilmesinde makine öğrenme algoritmalarının kullanımı amaçlanmıştır. ClinVar veri seti ile birden fazla çok sınıflı makine öğrenme algoritmaları kullanılarak makine öğrenme modelleri oluşturulmuştur. Daha küçük veri seti ile yapılan modelde çok sınıflı karar ağacı ile ortalamada 0,96 doğruluğa ulaşılırken ana veri setinde yine çok sınıflı karar ağacı ile 0,86 doğruluğa ulaşılmıştır. Çalışmada sık karşılaşılan tanımlı varyantların daha yüksek başarı ile tanımlandığı, yine iki sınıflı benign patojenik ayrımında modelin daha başarılı olduğu gösterilmiştir. Bu çalışma kopya sayısı varyantlarının klinik değerlendirilmesinde kullanılabilecek ve tanıyı otomatikleştirebilecek öncül bir makine öğrenme modeli oluşturulabileceğini göstermiştir.

Özet (Çeviri)

Copy number variations, that are losses or gains of particular DNA regions, are found about two percent in the human genome. This group which belongs to structural variations can be found in the healthy population and sometimes losses or gains specific regions can lead to clinical manifestations. Interpretation of clinical and genetic data, which also requires family work to interpret clinically the detected copy number variation, does not always provide accurate information. Increasing application of machine learning algorithms is getting widely used in the medical field and becoming increasingly important, especially in areas with large data such as genetics. The aim of this study is to use machine learning algorithms in clinical interpretation of copy number variations. Machine learning models were created using multiple multi-class machine learning algorithms with the ClinVar data set. In the model made with a smaller data set, the average accuracy of the multi-class decision forest is 0.96, while in the main data set, the accuracy of the multi-class decision forest is 0.86. In this study, it could be shown that the most common identified variants were interpreted with higher accuracy and the model was more successful when the two classes benign and pathogenic were separated. This preliminary study demonstrated that a machine learning model could be used to automate diagnosis and in the clinical interpretation of copy number variants.

Benzer Tezler

  1. Çok boyutlu otizm spektrum bozukluğu fenotipinin altında yatan kopya sayısı varyasyonlarının makine öğrenimi yöntemleriyle semptom tabanlı sınıflandırılması

    Symptom-based classification of copy number variations underlying the multidimensional autism spectrum disorder phenotype via machine learning

    HİLMİ BOLAT

    Doktora

    Türkçe

    Türkçe

    2024

    GenetikEge Üniversitesi

    Sağlık Biyoinformatiği Ana Bilim Dalı

    DOÇ. DR. BUKET KOSOVA

  2. Machine learning approach to quantification of intra-tumour heterogeneity using genomic, epigenomic and proteomic data

    Genomik, epigenomik ve proteomik verileri kullanarak tümor içi heterojenite nicelleştirmesine makine öğrenmesi yaklaşımı

    ERSİN ONUR ERDOĞAN

    Yüksek Lisans

    İngilizce

    İngilizce

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Üniversitesi-Cerrahpaşa

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ÖZGÜR CAN TURNA

  3. İntrakraniyal anevrizmalarda kopya sayısı varyasyonlarının array CGH yöntemi ile incelenmesi

    Investigation of copy number variations in intracranial aneurysms by array CGH method

    BETÜL ASLAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2021

    GenetikEskişehir Osmangazi Üniversitesi

    Tıbbi Genetik Ana Bilim Dalı

    PROF. DR. SEVİLHAN ARTAN

  4. Non-sendromik konjenital kalp hastalarında genomik kopya sayısı varyasyonlarının değerlendirilmesi

    Evaluation of genomic copy number variations in non-syndrome congenital heart diseases

    BÜŞRA ÖZKAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2021

    GenetikEskişehir Osmangazi Üniversitesi

    Tıbbi Genetik Ana Bilim Dalı

    PROF. DR. SEVİLHAN ARTAN

  5. Konjenital kalp hastalıklarında MLPa kullanılarak gen kopya sayısı varyasyonlarının analiz edilmesi

    Analysis of gene copy number variations in patients with congenital heart diseases by using MLPA

    ESRA TUBA MUTLU

    Doktora

    Türkçe

    Türkçe

    2016

    GenetikHacettepe Üniversitesi

    Pediatrik Temel Bilimler Ana Bilim Dalı

    PROF. DR. OSMAN KORAY BODUROĞLU