Geri Dön

Nadir metabolik hastalıklarda tüm ekzom dizileme verilerinin biyoinformatik analizleri ile fenotipten sorumlu varyantların değerlendirilmesi

Bioinformatics analysis and variant interpretation of whole exome sequencnig data in inborn errors of metabolism

  1. Tez No: 904803
  2. Yazar: CAN KOŞUKCU
  3. Danışmanlar: PROF. DR. RIZA KÖKSAL ÖZGÜL
  4. Tez Türü: Doktora
  5. Konular: Endokrinoloji ve Metabolizma Hastalıkları, Genetik, Endocrinology and Metabolic Diseases, Genetics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2024
  8. Dil: Türkçe
  9. Üniversite: Hacettepe Üniversitesi
  10. Enstitü: Sağlık Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Pediatrik Temel Bilimler Ana Bilim Dalı
  12. Bilim Dalı: Moleküler Metabolizma Bilim Dalı
  13. Sayfa Sayısı: 294

Özet

Kalıtsal metabolik hastalık kavramı ilk kez 1903 yılında Garrod tarafından ara metabolitlerin metabolik yıkımlarında rol alan enzimlerin fonksiyon bozukluğu sonucu ortaya çıkan genetik geçişli hastalıklar olarak tanımlanmıştır. Daha sonraki yıllarda hücre içerisinde çok değişik süreçlerde yer alan reseptör gibi enzim dışı proteinlerin fonksiyon bozukluğu sonucunda da metabolik hastalıkların oluşabileceği gösterilmiştir. Şimdiye kadar 700'den fazla kalıtsal metabolik hastalık tanımlanmış olup her geçen yıl yeni metabolik hastalıklar tanımlanmaktadır. İnsan genomunda ortalama 22.000 gen olduğu düşünüldüğünde, ilerleyen yıllarda kalıtsal metabolik hastalıkların sayısı yanında tanımında da değişiklikler olacaktır. Nitekim son yıllarda hücre içinde DNA ürünü proteinin fenotipe etkisi ile ilgili hücresel süreçlerin omiks teknolojileri ile değerlendirilmesi sonucunda metabolik hastalıklara klinik ve moleküler temelli bakış açısı tamamen değişmiştir. Metabolik hastalıklarda hücre içindeki kompartmanlar arası bilgi akışının nicel ve nitel olarak değerlendirilmesi, kurallarının belirlenmesi başta kalıtsal metabolik hastalıklar olmak üzere enfeksiyon hastalıklar gibi edinsel hastalıkların da tanı, tedavi ve izleminde yer alan geleneksel yaklaşımları kökten değiştirecektir. Metabolik hastalıklar patofizyolojik olarak intoksikasyon tipi (aminoasit metabolizması bozuklukları, galaktozemi vb.), enerji metabolizması bozuklukları (mitokondriyal hastalıklar) ve makromolekül hastalıkları (organel fonksiyon bozuklukları) olarak 3 grupta incelenir. İntoksikasyon tipi metabolik hastalıklarda enzim eksikliğine bağlı olarak enzim reaksiyonunun proksimalinde yer alan substratın birikimi ile gelişen toksik etki söz konusu iken, enerji metabolizması bozuklukları ATP molekülünün sentezinde rol alan enzim eksiklikleri sonucu gelişir (PDH eksikliği, Krebs döngüsü enzim eksiklikleri ve solunum zincir fonksiyon bozukluğu vs). Kompleks molekül hastalıkları genel olarak mitokondri dışındaki lizozom, perosizom, endoplazmik retikulum-Golgi cisimciği düzeneğinde rol alan enzim eksiklikleri sonucu gelişir. Lizozomal depo hastalıkları, peroksizomal hastalıklar ve kalıtsal gilkolizasyon bozuklukları bu grup hastalıkların klasik örneklerini oluşturur. Bununla birlikte bizim de içerisinde bulunduğumuz araştırma gruplarının yaptığı çalışmalar sonucunda veziküler trafik bozuklukları, otofaji fonksiyon bozuklukları gibi yeni hastalık grupları tanımlanmaya başlamıştır. Klinik fenotip olarak kalıtsal metabolik hastalıklar, hastalık tipine göre tekli ya da çoklu organ/sistem tutulumu ile kendini gösterir. Santral sinir sistemi metabolik hastalıklarda en sık tutulum gösteren sistemlerin başında gelir (>%55). Bu nedenle kalıtsal metabolik hastalıklarda erken tanı ve tedavinin gerçekleştirilmesi, bu hastalıklarda mortalite ve morbiditenin önlenmesi açısından çok önemlidir. Son yıllarda özellikle geleneksel yöntemlerle tanı konulamayan nadir ya da çok nadir metabolik hastalıkların tanısında ileri düzey genetik analiz yöntemlerinin kullanımı temel yaklaşım olmuştur. Özellikle tüm kodlayıcı gen bölgelerinin analizine olanak veren tüm ekzom dizi analizi yöntemi yeni hastalık genlerinin tanımlanması veya genetik heterojenite gösteren metabolik/nörometabolik hastalıkların moleküler tanısında en önemli araç haline gelmiştir. Ekzom analizleri yeni aday genlerin keşiflerine de ivme kazandırmıştır. Ekzom analizleri ile saptanan genlerin herhangi bir klinik fenotip ile ilişkilendirilmemesi durumunda yeni aday genler karşımıza çıkmaktadır. Bu süreç ister tüm genom ister tüm ekzom analizi ile olsun araştırmacıların ve giderek tıp pratiğinde klinisyenlerin önüne yorumlanması gereken devasa bir bilgi yığını koymuştur. Bu bilgi yığını içerisinden hastalıktan sorumlu olan tek bir aday genin bulunması süreci, tıp pratiğinin şimdiden en temel çalışma alanı olan biyoinformatik bilim dalını yaratmıştır. Devasa bilgi yığınına fenotip eşliğinde en uygun soruları sormak ve yanıtların en uygun şekilde değerlendirilmesi biyoinfomatiğin temel sürecini oluşturur. Bu nedenle biyoinformatik analize klinik ile ilgili derin fenotip bilgilerinin eşlik etmesi şarttır. Bunun yanında patojenitenin tahminlenmesi, kopya sayısı analizi, protein modelleme, bağlantı analizleri vb. gibi in siliko analiz metodları hastalıktan sorumlu tek bir aday genin belirlenmesi sürecinde biyoinformatik analizi yapan araştırmacıya kılavuzluk eder. Biyoinformatik analizler ham verinin işlenmesi sürecinde, aday genlerin belirlenmesi, genetik varyasyonların tespiti ve filtrelenmesi ile patojenik mutasyonların saptanmasındaki en kritik basamaktır. Verinin ileri düzey biyoinformatik analizi ile farklı mutasyon tipleri (yanlış anlamlı, anlamsız, kırpılma, küçük insersiyon/delesyon tipi mutasyonlar) saptanabilirken büyük boyutlardaki kopya sayısı değişiklikleri de belirlenebilmektedir. Bu doktora tez çalışmasında Tüm Ekzom Dizileme verilerinin biyoinformatik analizi için birden fazla yazılım kullanılmıştır. FASTQ verilerinin hizalanmasında (alignment) BWA (Burrows-Wheeler Aligner), Tekrar dizilerinin elenmesi için SAMtools, ekzonik bölgelerin okuma derinliklerinin hesaplanması için BEDtools ve varyant çağırma basamakları için GATK yazılımları kullanılmıştır. Yeniden analiz edilen ham veriler ve kopya sayısı değişikliği (CNV) tespiti için CLC Genomics Server 24.0.1 yazılımından yararlanılmıştır. Yanlış anlamlı mutasyonların PDB dosyaları kullanılarak modellenmesinden önce PDB yapılarının onarılması için FoldX yazılımı kullanılmıştır. Yapılan in-silico protein modellemelerinde ΔΔG değerlerinin hesaplanması için dört farklı yazılım kullanılmıştır (DynaMut2 PremPS INPS-3D ve FoldX). Bulunan varyantlara ait genlerin ve saptanan literatürde bildirilmemiş yeni genlerin birbirleri ile olan etkileşimlerini yansıtan bağlantı analizleri (Network analysis) STRING 12.0 yazılımı ile gerçekleştirilmiştir. Bu çalışmada biyoinformatik yöntemlerle 162 aileden 213 bireye ait Tüm Ekzom Dizileme verisinin ham veri analizleri gerçekleştirilmiş ve elde edilen sonuçlar yorumlanmıştır. 155 olguya kesin tanı konulmuştur ve toplamda ulaşılan varyant sayısı 170 olarak hesaplanmıştır. Kesin tanıya ulaşılan vakaların 103'ünde yanlış anlamlı mutasyon (%61), 18'inde çerçeve kayması mutasyonu (%10), 17'sinde anlamsız mutasyon (%10), 17'sinde kırpılma mutasyonu (%10), 6'sında kopya sayısı değişikliği (%4), 5'inde başlangıç kodonu mutasyonu (%3), 4'ünde ise in-frame delesyon veya insersiyon (%2) tespit edilmiştir. Belirlenen 103 yanlış anlamlı mutasyon dört farklı yöntem ile protein yapısı üzerinde modellenmiş ve in-silico tahminlemeler gerçekleştirilerek mutasyonun protein yapısı üzerinde oluşturduğu yapısal değişiklikler şematize edilmiştir. Saptanan varyantlar, gen düzeyinde bağlantı analizine tabi tutularak nadir kalıtsal metabolik hastalık grubundaki moleküler yolaklar arasındaki ilişkiler tespit edilmiş, belirlenen yeni genlerin bu yolaklar içerisinde ne şekilde konumlandığı araştırılmıştır. Bu tez çalışmasında toplamda 162 aileden 213 bireyde gerçekleştirilen WES analizi sonucunda hastaların 155'ine moleküler tanı konulmuş, 58 vaka ise sonuçsuz kalmıştır. Buna göre yapılan biyoinformatik analizlerde başarılı moleküler tanı oranı %73 olarak hesaplanmıştır. Tüm Ekzom Dizileme verisinin elde edilmesinde kullanılan laboratuvar yöntemleri ve dizileme tekniklerinin son derece gelişmiş olmasına karşın doğru ve kapsamlı biyoinformatik analizlerin yapılması, klinik yorumlamada son derece önemlidir.

Özet (Çeviri)

Inborn errors of metabolism are pathophysiologically examined in three groups, as intoxication type (amino acid metabolism disorders, galactosemia, etc.), energy metabolism disorders (mitochondrial diseases) and macromolecular diseases (organelle dysfunctions). In intoxication type metabolic diseases, there is a toxic effect that develops with the accumulation of the substrate located proximal to the enzyme reaction due to enzyme deficiency, while energy metabolism disorders develop as a result of enzyme deficiencies involved in the synthesis of the ATP molecule (PDH deficiency, Krebs cycle enzyme deficiencies and respiratory chain dysfunction, etc.). Complex molecule diseases generally develop as a result of enzyme deficiencies involved in the lysosome, peroxisome, endoplasmic reticulum-Golgi apparatus mechanism outside the mitochondria. Lysosomal storage diseases, peroxisomal diseases and hereditary glycation disorders are classic examples of this group of diseases. However, as a result of the studies carried out by research groups in which we are a part, new disease groups such as vesicular traffic disorders and autophagy dysfunctions have begun to be defined. As a clinical phenotype, hereditary metabolic diseases manifest themselves with single or multiple organ/system involvement, depending on the disease type. The central nervous system is one of the systems most frequently involved in metabolic diseases (>55%). Therefore, early diagnosis and treatment of hereditary metabolic diseases is very important to prevent mortality and morbidity in these diseases. In recent years, the use of advanced genetic analysis methods has become the main approach in the diagnosis of rare or very rare metabolic diseases that cannot be diagnosed by traditional methods. In particular, the whole exome sequence analysis method, which allows the analysis of all coding gene regions, has become the most important tool in the identification of new disease genes or in the molecular diagnosis of metabolic/neurometabolic diseases that show genetic heterogeneity. Exome analyzes have also accelerated the discovery of new candidate genes. If the genes detected by exome analyzes are not associated with any clinical phenotype, new candidate genes emerge. This process, whether through whole genome or whole exome analysis, has placed a huge pile of information that needs to be interpreted in front of researchers and increasingly clinicians in medical practice. The process of finding a single candidate gene responsible for a disease from this mass of information has created the field of bioinformatics, which is already the most fundamental field of study in medical practice. Asking the most appropriate questions to the huge pile of information in the context of the phenotype and evaluating the answers in the most appropriate way constitute the basic process of bioinformatics. Therefore, it is essential that bioinformatic analysis be accompanied by in-depth clinically relevant phenotype information. In addition, prediction of pathogenicity, copy number analysis, protein modeling, pathway analysis, etc. In-silico analysis methods such as these guide the researcher performing bioinformatics analysis in the process of identifying a single candidate gene responsible for the disease. Bioinformatics analysis is the most critical step in the processing of raw data, identifying candidate genes, detecting and filtering genetic variations, and detecting pathogenic mutations. With advanced bioinformatics analysis of the data, different mutation types (missense, nonsense, truncation, small INDELs) can be detected, while large copy number changes can also be determined. In this doctoral thesis, multiple software tools were utilized for the bioinformatic analysis of Whole Exome Sequencing (WES) data. BWA (Burrows-Wheeler Aligner) was used for aligning FASTQ data, SAMtools for filtering repetitive sequences, BEDtools for calculating the read depth of exonic regions, and GATK for the variant calling steps. CLC Genomics Server 24.0.1 was employed for reanalysis of raw data and detection of copy number variations (CNVs). FoldX software was used for repairing PDB structures prior to modeling missense mutations using PDB files. In the in-silico protein modeling, four different software tools (DynaMut2, PremPS, INPS-3D, and FoldX) were used to calculate ΔΔG values. Pathway analyses reflecting the interactions between the identified genes and newly discovered genes that have not been reported in the literature were conducted using the STRING 12.0 software. In this study, raw data analyses of Whole Exome Sequencing from 213 individuals across 162 families were performed using bioinformatic methods and the results were interpreted. A definitive diagnosis was made for 155 cases, and the total number of identified variants was calculated as 170. Among the cases with a definitive diagnosis, 103 had missense mutations (61%), 18 had frameshift mutations (10%), 17 had nonsense mutations (10%), 17 had splice site mutations (10%), 6 had copy number variations (4%), 5 had start codon mutations (3%), and 4 had in-frame deletions or insertions (2%). The 103 identified missense mutations were modeled on the protein structure using four different methods, and in-silico predictions were conducted to illustrate the structural changes induced by the mutations on the protein structure. The identified variants were subjected to pathway analysis at the gene level to detect relationships among the molecular pathways involved in rare inherited metabolic diseases and to explore the positioning of newly identified genes within these pathways. In this thesis study, WES analysis was performed on 213 individuals from a total of 162 families, resulting in molecular diagnosis for 155 patients, while 58 cases remained undiagnosed. Accordingly, the success rate of molecular diagnosis in the bioinformatic analyses was calculated as 73%. Although, the laboratory methods and sequencing techniques used to obtain Whole Exome Sequencing data are highly developed, accurate and comprehensive bioinformatics analyzes are extremely important in clinical interpretation.

Benzer Tezler

  1. Çanakkale örnekleminde tüm ekzom dizileme (Wes) ile elde edilen verilerden konjenital monosakkarit ve disakkarit metabolizma bozuklukları ile ilişkili genetik varyantların güncel verilerle değerlendirilmesi ve taşıyıcılık oranlarının belirlenmesi

    Evaluation of genetic variants related to congenital monosaccharide and disaccharide metabolism disorders from data obtained by whole exome sequencing (Wes) in the Çanakkale sample with current data, and determination of carrier ratios

    MEHMET BERKAY AKCAN

    Tıpta Uzmanlık

    Türkçe

    Türkçe

    2023

    GenetikÇanakkale Onsekiz Mart Üniversitesi

    Tıbbi Genetik Ana Bilim Dalı

    PROF. DR. FATMA SILAN

  2. Tanı konulamayan kalıtsal metabolik hastalıklarda tümekzom dizi analizinin katkısı

    Diagnostic utility of whole exome sequencing inundiagnosed inborn errors of metabolism

    ASUMAN GEDİKBAŞI

    Doktora

    Türkçe

    Türkçe

    2021

    Genetikİstanbul Üniversitesi

    Genetik Ana Bilim Dalı

    PROF. DR. ZEHRA OYA UYGUNER

  3. İzole katarakt tanılı çocuk olgularda tüm ekzom sekanslama yöntemiyle mutasyon taranması

    Mutation screening by whole exome securing method in child patients with isolated cataract

    GUNAY AMANOVA

    Tıpta Uzmanlık

    Türkçe

    Türkçe

    2021

    GenetikEge Üniversitesi

    Çocuk Sağlığı ve Hastalıkları Ana Bilim Dalı

    PROF. DR. MUHSİN ÖZGÜR ÇOĞULU

  4. Sendromik epilepsi hastalarında molekülergenetik analiz sonuçlarının değerlendirilmesi

    Başlık çevirisi yok

    HAMZA POLAT

    Tıpta Uzmanlık

    Türkçe

    Türkçe

    2023

    GenetikMarmara Üniversitesi

    Tıbbi Genetik Ana Bilim Dalı

    DOÇ. DR. BİLGEN BİLGE GEÇKİNLİ

  5. New genomic approaches to explore the neurogenetic disease burden of consanguineous marriages in turkey

    Türkiye'deki akraba evliliklerine bağlı nörogenetik hastalık yükünün araştırılmasında yeni genomik yaklaşımlar

    ELMASNUR YILMAZ

    Yüksek Lisans

    İngilizce

    İngilizce

    2018

    BiyolojiDokuz Eylül Üniversitesi

    Moleküler Biyoloji ve Genetik Bilim Dalı

    DR. ÖĞR. ÜYESİ YAVUZ OKTAY