Kopya sayısı varyasyonlarının makine öğrenme yöntemi ile analiz edilmesi
Analysis of copy number variations with machine learning technics
- Tez No: 608275
- Danışmanlar: DOÇ. DR. BUKET KOSOVA
- Tez Türü: Doktora
- Konular: Bilim ve Teknoloji, Genetik, Science and Technology, Genetics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2019
- Dil: Türkçe
- Üniversite: Ege Üniversitesi
- Enstitü: Sağlık Bilimleri Enstitüsü
- Ana Bilim Dalı: Sağlık Biyoinformatiği Ana Bilim Dalı
- Bilim Dalı: Sağlık Biyoinformatiği Bilim Dalı
- Sayfa Sayısı: 69
Özet
Kopya sayısı varyasyonları insan genomunun yaklaşık yüzde ikisinde bulunan belirli bir DNA bölgesinin kayıp veya kazançlarıdır. Yapısal varyasyonlar arasında yer alan bu grup sağlıklı popülasyonda bulunabileceği gibi ilgili bölgenin kayıp veya kazançları klinik tablolarla ilişkilendirilebilir. Tespit edilen kopya sayısı varyasyonunun klinik olarak yorumlamak aile çalışmasını da gerektiren, klinik ve genetik verinin değerlendirme sürecidir ve her zaman doğru bilgiye ulaşılamamaktadır. Kullanımı artan makine öğrenme algoritmaları tıp alanında da kullanılmakta ve özellikle büyük veri setlerinin bulunduğu genetik gibi alanlarda giderek önem kazanmaktadır. Bu çalışma ile kopya sayısı varyasyonlarının klinik açıdan değerlendirilmesinde makine öğrenme algoritmalarının kullanımı amaçlanmıştır. ClinVar veri seti ile birden fazla çok sınıflı makine öğrenme algoritmaları kullanılarak makine öğrenme modelleri oluşturulmuştur. Daha küçük veri seti ile yapılan modelde çok sınıflı karar ağacı ile ortalamada 0,96 doğruluğa ulaşılırken ana veri setinde yine çok sınıflı karar ağacı ile 0,86 doğruluğa ulaşılmıştır. Çalışmada sık karşılaşılan tanımlı varyantların daha yüksek başarı ile tanımlandığı, yine iki sınıflı benign patojenik ayrımında modelin daha başarılı olduğu gösterilmiştir. Bu çalışma kopya sayısı varyantlarının klinik değerlendirilmesinde kullanılabilecek ve tanıyı otomatikleştirebilecek öncül bir makine öğrenme modeli oluşturulabileceğini göstermiştir.
Özet (Çeviri)
Copy number variations, that are losses or gains of particular DNA regions, are found about two percent in the human genome. This group which belongs to structural variations can be found in the healthy population and sometimes losses or gains specific regions can lead to clinical manifestations. Interpretation of clinical and genetic data, which also requires family work to interpret clinically the detected copy number variation, does not always provide accurate information. Increasing application of machine learning algorithms is getting widely used in the medical field and becoming increasingly important, especially in areas with large data such as genetics. The aim of this study is to use machine learning algorithms in clinical interpretation of copy number variations. Machine learning models were created using multiple multi-class machine learning algorithms with the ClinVar data set. In the model made with a smaller data set, the average accuracy of the multi-class decision forest is 0.96, while in the main data set, the accuracy of the multi-class decision forest is 0.86. In this study, it could be shown that the most common identified variants were interpreted with higher accuracy and the model was more successful when the two classes benign and pathogenic were separated. This preliminary study demonstrated that a machine learning model could be used to automate diagnosis and in the clinical interpretation of copy number variants.
Benzer Tezler
- Çok boyutlu otizm spektrum bozukluğu fenotipinin altında yatan kopya sayısı varyasyonlarının makine öğrenimi yöntemleriyle semptom tabanlı sınıflandırılması
Symptom-based classification of copy number variations underlying the multidimensional autism spectrum disorder phenotype via machine learning
HİLMİ BOLAT
- Machine learning approach to quantification of intra-tumour heterogeneity using genomic, epigenomic and proteomic data
Genomik, epigenomik ve proteomik verileri kullanarak tümor içi heterojenite nicelleştirmesine makine öğrenmesi yaklaşımı
ERSİN ONUR ERDOĞAN
Yüksek Lisans
İngilizce
2021
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Üniversitesi-CerrahpaşaBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ÖZGÜR CAN TURNA
- İntrakraniyal anevrizmalarda kopya sayısı varyasyonlarının array CGH yöntemi ile incelenmesi
Investigation of copy number variations in intracranial aneurysms by array CGH method
BETÜL ASLAN
Yüksek Lisans
Türkçe
2021
GenetikEskişehir Osmangazi ÜniversitesiTıbbi Genetik Ana Bilim Dalı
PROF. DR. SEVİLHAN ARTAN
- Non-sendromik konjenital kalp hastalarında genomik kopya sayısı varyasyonlarının değerlendirilmesi
Evaluation of genomic copy number variations in non-syndrome congenital heart diseases
BÜŞRA ÖZKAN
Yüksek Lisans
Türkçe
2021
GenetikEskişehir Osmangazi ÜniversitesiTıbbi Genetik Ana Bilim Dalı
PROF. DR. SEVİLHAN ARTAN
- Konjenital kalp hastalıklarında MLPa kullanılarak gen kopya sayısı varyasyonlarının analiz edilmesi
Analysis of gene copy number variations in patients with congenital heart diseases by using MLPA
ESRA TUBA MUTLU
Doktora
Türkçe
2016
GenetikHacettepe ÜniversitesiPediatrik Temel Bilimler Ana Bilim Dalı
PROF. DR. OSMAN KORAY BODUROĞLU