Integration of machine learning and entropy methods for post-genome-wide association studies analysis
Genom boyunca ilişkilendirme çalışmaları sonrası analizi için makine öğrenmesi ve entropi yöntemlerinin entegrasyonu
- Tez No: 756154
- Danışmanlar: DOÇ. DR. YEŞİM AYDIN SON
- Tez Türü: Doktora
- Konular: Genetik, Genetics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2022
- Dil: İngilizce
- Üniversite: Orta Doğu Teknik Üniversitesi
- Enstitü: Enformatik Enstitüsü
- Ana Bilim Dalı: Sağlık Bilişimi Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 93
Özet
Genotipler arasındaki doğrusal olmayan ilişkiler, kompleks hastalık özelliklerinin genetik etkileşimlerini anlamada önemli bir rol oynar. Genom Boyutunda İlişkilendirme Çalışmaları (GWAS), birçok kompleks hastalıkta SNP'lerin istatistiksel ilişkisini ortaya çıkarmıştır. GWAS sonuçları bu bozuklukların genetik arka planını tam olarak açıklayamadığından, Genom Boyutunda Etkileşim Çalışmaları önem kazanmaya başlamıştır. Son yıllarda, varyantlar arasındaki bu toplamsal olmayan etkileşimleri ortaya çıkarmak için entropi tabanlı yöntemler gibi çeşitli istatistiksel yaklaşımlar önerilmiştir. Bu çalışmada, Geç Başlangıçlı Alzheimer Hastalığı'nda (LOAD) erken ve ayırıcı tanı belirteçlerini keşfetmek amacı ile genotipler arasındaki doğrusal olmayan ilişkilerden kaynaklanan gizli örüntüleri ortaya çıkarmak için entropi tabanlı üçlü etkileşim bilgi yöntemi (3WII) ile bir makine öğrenmesi(PLINK-Random Forest-Random Forest) iş akışı entegre edilmiştir. Üç farklı LOAD veri seti ıle geliştirilmiş PLINK-RF-RF modellerindeki üçüncü dereceden etkileşimlerin yakalanmasını sağlayan entropi tabanlı yaklaşımı optimize edilmiştir. PLINK-RF-RF ile önceliklendirilmiş SNPlerin 3WII analizi ile üç veri kümesinin tümü için indirgenmiş bir SNP seti seçilmiş olup bu yaklaşım, bir model minimizasyon yaklaşımı olarak umut vericidir. 3WII açısından vaka ve kontrol grupları arasında anlamlı farklılık gösteren seçilmiş SNP üçlüleri, genotiplendirmeye dayalı LOAD teşhisi için aday biyobelirteçler olarak önerilmektedir. 3WII tarafından önceliklendirilen SNP'lerden; GenADA'dan gelen 19 SNP'den 4'ü, ADNI'den gelen 27 SNP'den 1'i ve NCRADdan gelen 106 SNP'den 4'ü, Alzheimer Hastalığı ile doğrudan ilişkili genlere haritalandırılmıştır. Bu çalışmada, LOAD'da üç yönlü epistatik etkileşimleri belirlemek için ilk kez RF-RF modeli entropi tabanlı model ile entegre edilmiş ve ADNI, GenADA ve NCRAD veri setlerinin ortak biyolojik yolakları keşfedilmiştir.
Özet (Çeviri)
Non-linear relationships between genotypes play an essential role in understanding the genetic interactions of complex disease traits. Genome-Wide Association Studies (GWAS) have revealed a statistical association between the SNPs in many complex diseases. As GWAS results could not thoroughly explain the genetic background of these disorders, Genome-Wide Interaction Studies started to gain importance. In recent years, various statistical approaches such as entropy-based methods have been suggested for revealing these non-additive interactions between variants. This study integrates an entropy-based 3-way interaction information method and machine learning (PLINK-Random Forest-Random Forest) workflow to capture the hidden patterns resulting from non-linear relationships between genotypes in Late-Onset Alzheimer's Disease (LOAD) to discover early and differential diagnosis markers. We have optimized an entropy-based approach that detects the third-order interactions in PLINK-RF-RF models from three different LOAD datasets. A reduced SNP set was selected for all three datasets by 3WII analysis of PLINK-RF-RF prioritized SNPs, promising a model minimization approach. Selected triplets of SNPs that show significant differences between case and control groups in terms of 3WII are proposed as candidate biomarkers for a genotyping-based LOAD diagnosis. Among SNPs prioritized by 3WII, four out of 19 SNPs from GenADA, one out of 27 from ADNI, and four out of 106 NCRAD are mapped to genes directly associated with Alzheimer's Disease. For the first time, we have integrated the RF-RF model with the entropy-based model for determining the three-way epistatic interactions for LOAD and discovered the common biological pathways for ADNI, GenADA, and NCRAD datasets.
Benzer Tezler
- Dağıtık üretim güç sistemlerinde geliştirilmiş oylama modeli tabanlı arıza tespiti ve sınıflandırması
Improved voting model based fault detection and classification in distributed generation power systems
FEVZEDDİN ÜLKER
Doktora
Türkçe
2023
Elektrik ve Elektronik MühendisliğiSakarya ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ AHMET KÜÇÜKER
- District-based urban sprawl monitoring and modelling using CA-Markov model: application in two mega cities
İlçe bazlı kentsel yayılma izleme ve CA-Markov model ile modelleme: iki mega şehirde uygulama
ANALI AZABDAFTARI
Doktora
İngilizce
2022
İletişim Bilimleriİstanbul Teknik Üniversitesiİletişim Sistemleri Ana Bilim Dalı
PROF. DR. AYŞE FİLİZ SUNAR
- Object-based urban land cover extraction using the synergy of lidar data and very high resolution multispectral imagery
Lidar verisi ve çok yüksek çözünürlüklü çok bantlı görüntü sinerjisini kullanarak nesne-tabanlı kentsel arazı örtüsü çıkarımı
ENES HALICI
Yüksek Lisans
İngilizce
2023
Jeodezi ve FotogrametriHacettepe ÜniversitesiGeomatik Mühendisliği Ana Bilim Dalı
PROF. DR. MUSTAFA TÜRKER
- Türkiye rüzgâr verilerinin bayesyen maksimum entropi yaklaşımıyla uzay-zaman modeli
Spatiotemporal model of Turkey wind speed data with Bayesian maximum entropy approach
ÖZLEM BAYDAROĞLU
Doktora
Türkçe
2016
Enerjiİstanbul Teknik ÜniversitesiMeteoroloji Mühendisliği Ana Bilim Dalı
PROF. DR. KASIM KOÇAK
- Machine learning techniques for surface electromyography based hand gesture recognition
Yüzey elektromiyografi temelli el jesti tanıma için makine öğrenmesi teknikleri
ENGİN KAYA
Yüksek Lisans
İngilizce
2018
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiKontrol ve Otomasyon Mühendisliği Ana Bilim Dalı
DOÇ. DR. TUFAN KUMBASAR