Geri Dön

Integration of machine learning and entropy methods for post-genome-wide association studies analysis

Genom boyunca ilişkilendirme çalışmaları sonrası analizi için makine öğrenmesi ve entropi yöntemlerinin entegrasyonu

  1. Tez No: 756154
  2. Yazar: BURCU YALDIZ
  3. Danışmanlar: DOÇ. DR. YEŞİM AYDIN SON
  4. Tez Türü: Doktora
  5. Konular: Genetik, Genetics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2022
  8. Dil: İngilizce
  9. Üniversite: Orta Doğu Teknik Üniversitesi
  10. Enstitü: Enformatik Enstitüsü
  11. Ana Bilim Dalı: Sağlık Bilişimi Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 93

Özet

Genotipler arasındaki doğrusal olmayan ilişkiler, kompleks hastalık özelliklerinin genetik etkileşimlerini anlamada önemli bir rol oynar. Genom Boyutunda İlişkilendirme Çalışmaları (GWAS), birçok kompleks hastalıkta SNP'lerin istatistiksel ilişkisini ortaya çıkarmıştır. GWAS sonuçları bu bozuklukların genetik arka planını tam olarak açıklayamadığından, Genom Boyutunda Etkileşim Çalışmaları önem kazanmaya başlamıştır. Son yıllarda, varyantlar arasındaki bu toplamsal olmayan etkileşimleri ortaya çıkarmak için entropi tabanlı yöntemler gibi çeşitli istatistiksel yaklaşımlar önerilmiştir. Bu çalışmada, Geç Başlangıçlı Alzheimer Hastalığı'nda (LOAD) erken ve ayırıcı tanı belirteçlerini keşfetmek amacı ile genotipler arasındaki doğrusal olmayan ilişkilerden kaynaklanan gizli örüntüleri ortaya çıkarmak için entropi tabanlı üçlü etkileşim bilgi yöntemi (3WII) ile bir makine öğrenmesi(PLINK-Random Forest-Random Forest) iş akışı entegre edilmiştir. Üç farklı LOAD veri seti ıle geliştirilmiş PLINK-RF-RF modellerindeki üçüncü dereceden etkileşimlerin yakalanmasını sağlayan entropi tabanlı yaklaşımı optimize edilmiştir. PLINK-RF-RF ile önceliklendirilmiş SNPlerin 3WII analizi ile üç veri kümesinin tümü için indirgenmiş bir SNP seti seçilmiş olup bu yaklaşım, bir model minimizasyon yaklaşımı olarak umut vericidir. 3WII açısından vaka ve kontrol grupları arasında anlamlı farklılık gösteren seçilmiş SNP üçlüleri, genotiplendirmeye dayalı LOAD teşhisi için aday biyobelirteçler olarak önerilmektedir. 3WII tarafından önceliklendirilen SNP'lerden; GenADA'dan gelen 19 SNP'den 4'ü, ADNI'den gelen 27 SNP'den 1'i ve NCRADdan gelen 106 SNP'den 4'ü, Alzheimer Hastalığı ile doğrudan ilişkili genlere haritalandırılmıştır. Bu çalışmada, LOAD'da üç yönlü epistatik etkileşimleri belirlemek için ilk kez RF-RF modeli entropi tabanlı model ile entegre edilmiş ve ADNI, GenADA ve NCRAD veri setlerinin ortak biyolojik yolakları keşfedilmiştir.

Özet (Çeviri)

Non-linear relationships between genotypes play an essential role in understanding the genetic interactions of complex disease traits. Genome-Wide Association Studies (GWAS) have revealed a statistical association between the SNPs in many complex diseases. As GWAS results could not thoroughly explain the genetic background of these disorders, Genome-Wide Interaction Studies started to gain importance. In recent years, various statistical approaches such as entropy-based methods have been suggested for revealing these non-additive interactions between variants. This study integrates an entropy-based 3-way interaction information method and machine learning (PLINK-Random Forest-Random Forest) workflow to capture the hidden patterns resulting from non-linear relationships between genotypes in Late-Onset Alzheimer's Disease (LOAD) to discover early and differential diagnosis markers. We have optimized an entropy-based approach that detects the third-order interactions in PLINK-RF-RF models from three different LOAD datasets. A reduced SNP set was selected for all three datasets by 3WII analysis of PLINK-RF-RF prioritized SNPs, promising a model minimization approach. Selected triplets of SNPs that show significant differences between case and control groups in terms of 3WII are proposed as candidate biomarkers for a genotyping-based LOAD diagnosis. Among SNPs prioritized by 3WII, four out of 19 SNPs from GenADA, one out of 27 from ADNI, and four out of 106 NCRAD are mapped to genes directly associated with Alzheimer's Disease. For the first time, we have integrated the RF-RF model with the entropy-based model for determining the three-way epistatic interactions for LOAD and discovered the common biological pathways for ADNI, GenADA, and NCRAD datasets.

Benzer Tezler

  1. Dağıtık üretim güç sistemlerinde geliştirilmiş oylama modeli tabanlı arıza tespiti ve sınıflandırması

    Improved voting model based fault detection and classification in distributed generation power systems

    FEVZEDDİN ÜLKER

    Doktora

    Türkçe

    Türkçe

    2023

    Elektrik ve Elektronik MühendisliğiSakarya Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ AHMET KÜÇÜKER

  2. District-based urban sprawl monitoring and modelling using CA-Markov model: application in two mega cities

    İlçe bazlı kentsel yayılma izleme ve CA-Markov model ile modelleme: iki mega şehirde uygulama

    ANALI AZABDAFTARI

    Doktora

    İngilizce

    İngilizce

    2022

    İletişim Bilimleriİstanbul Teknik Üniversitesi

    İletişim Sistemleri Ana Bilim Dalı

    PROF. DR. AYŞE FİLİZ SUNAR

  3. Object-based urban land cover extraction using the synergy of lidar data and very high resolution multispectral imagery

    Lidar verisi ve çok yüksek çözünürlüklü çok bantlı görüntü sinerjisini kullanarak nesne-tabanlı kentsel arazı örtüsü çıkarımı

    ENES HALICI

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Jeodezi ve FotogrametriHacettepe Üniversitesi

    Geomatik Mühendisliği Ana Bilim Dalı

    PROF. DR. MUSTAFA TÜRKER

  4. Türkiye rüzgâr verilerinin bayesyen maksimum entropi yaklaşımıyla uzay-zaman modeli

    Spatiotemporal model of Turkey wind speed data with Bayesian maximum entropy approach

    ÖZLEM BAYDAROĞLU

    Doktora

    Türkçe

    Türkçe

    2016

    Enerjiİstanbul Teknik Üniversitesi

    Meteoroloji Mühendisliği Ana Bilim Dalı

    PROF. DR. KASIM KOÇAK

  5. Machine learning techniques for surface electromyography based hand gesture recognition

    Yüzey elektromiyografi temelli el jesti tanıma için makine öğrenmesi teknikleri

    ENGİN KAYA

    Yüksek Lisans

    İngilizce

    İngilizce

    2018

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Kontrol ve Otomasyon Mühendisliği Ana Bilim Dalı

    DOÇ. DR. TUFAN KUMBASAR