Genetik epidemiyolojide genelleştirilmiş doğrusal modeller yaklaşımı
Generalized linear models approach in genetic epidemiology
- Tez No: 444648
- Danışmanlar: DOÇ. DR. SERPİL AKTAŞ ALTUNAY
- Tez Türü: Doktora
- Konular: Biyoistatistik, Genetik, İstatistik, Biostatistics, Genetics, Statistics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2016
- Dil: Türkçe
- Üniversite: Hacettepe Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: İstatistik Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 106
Özet
Genetik epidemiyoloji, insan popülasyonlarında hastalıklara neden olan ve bu hastalıkların ailelerdeki kalıtım durumlarına etki eden genetik ve çevresel faktörlerin birlikte davranışını inceleyen bilim dalıdır. Genetik epidemiyoloji çalışmalarında insan genlerinin hastalıklar üzerindeki olası etkileri konusunda veri toplanması, genlerin diğer risk faktörleri ile etkileşimlerinin saptanması, hastalığın modellenmesi ve hastalığa neden olan gen ya da gen bölgelerinin tespit edilmesinde istatistiğin katkısı oldukça fazladır. Özellikle kalıtsal hastalığa neden olan varyantların tespit edildiği genetik ilişki analizlerinde, hastalık fenotipine ait gözlem değerleri, genetik ve çevresel faktörlerin doğrusal bir birleşimi olarak, genelleştirilmiş doğrusal modeller yardımıyla ifade edilebilmektedir. Genetik ilişki analizlerine ilişkin parametre tahmininde veri yapısı oldukça önemlidir. İlişkisiz veri varlığında, istatistiksel model parametrelerinin tahmininde gözlemlerin birbirinden bağımsız olduğu varsayımı kullanılır. Ancak genetik epidemiyolojide, hastalığın kalıtım yapısı hakkında bilgi sağlayan pedigrisel veri varlığında, bağımsızlık varsayımı bozulmaktadır. Özellikle ailelerdeki bütün bireylere yönelik bir deney tasarımı oluşturulduysa, pedigrisel korelasyon söz konusu olacaktır ve bu durumda bireylerdeki benzerliklerin de hesaba katıldığı karma etkiler modelleri gibi daha ileri düzey istatistiksel modelleme tekniklerine ihtiyaç duyulacaktır. Özellikle son yıllarda biyoteknoloji alanındaki ilerlemeler sayesinde genetik bilgiye ulaşılabilirlik artmış ve beraberinde genomun tamamını inceleyen genom düzeyinde ilişki çalışmaları gündeme gelmiştir. Özellikle bir ya da birkaç gen bölgesini test etmeye yarayan metotlarla karşılaştırıldığında, GWAS çalışmaları sayesinde büyük örneklemlerde, yaklaşık olarak 1 milyon SNP çip içeren genomun tamamının eş zamanlı olarak incelenmesi mümkün hale gelmiştir. Tez çalışmasında, genetik epidemiyolojide genler ve çevresel faktörler arasındaki ilişkileri ortaya koyan ve özellikle çok faktörlü karmaşık yapıdaki hastalıkların nedeninde çözüm olarak kullanılabilecek ileri düzeydeki istatistiksel yöntemler incelenmiştir. Çalışmada özellikle yeni nesil dizileme tekniği ile elde edilmiş, geniş ölçekli bir genetik epidemiyoloji çalışmaları dikkate alınarak yeni bir model önerilmiştir. Tez çalışmasında ilk olarak ailesel agregasyon varlığı analiz edilerek, genetik ilişkiler incelenmiştir ve tespit edilen karmaşık korelasyon yapılarından yola çıkılarak, ailesel ve serisel korelasyon varlığında, heterojen dağılım gösteren fenotip ile genetik bilginin genom boyunca modellenmesi amacı ile“Genelleştirilmiş Çok Aşamalı Düzeltilmiş Gizli Sınıflı Doğrusal Karma Model”isimli bir model önerilmiştir. Bununla birlikte ilişkili veriler varlığında çözüm olarak geliştirilen“Genelleştirilmiş Tahmin Eşitlikleri”de veri yapısındaki çoklu ilişkili durum varlığında uygulanabilecek şekilde geliştirilerek, aday gen bölgelerinin genetik ilişki analizinde kullanılmıştır. Önerilen model, Genetic Analysis Workshop (GAW) veri setine uygulanarak, genomun tamamı analiz edilmiş ve model sonuçları standart model ve literatür sonuçları ile karşılaştırılmıştır. Bununla birlikte simülasyon verileri üzerinden modelin gücü tartışılmıştır. Model karşılaştırması sonucunda, önerilen modele ilişkin bilgi kriteri genomik kontrol parametresi, standart modele göre daha küçük elde edilmiştir. Güç analizi sonucunda ise önerilen modelin daha güçlü olduğu sonucuna varılmıştır.
Özet (Çeviri)
Genetic epidemiology is the discipline which investigates the joint behavior of genetic and environmental factors that cause the diseases and effect the heredity structure of these diseases in human populations. In genetic epidemiology studies, statistics has an important role in collecting data about the possible effects of the human genes, detecting the gene-environment interactions, modelling the disease and investigating the gene or gene regions that cause the disease. Especially in the genetic association analysis in which the disease causing variants can be identified, the disease phenotype can be expressed as a linear combination of genetic and environmental factors by the help of generalized linear models. In the parameter estimation of genetic association studies, the structure of data is very important. In the presence of unrelated data, the assumption of independent observations is used in the parameter estimation of statistical model. However, in genetic epidemiology, in the presence of pedigree data which supplies information about the heredity structure of the disease, the assumption of independent observations is violated. Particularly, if the experimental design of the study includes all the members of the pedigree, the familial correlation will occur and in this situation advanced statistical modelling techniques such as mixed models which accounts for the individual similarities will be needed. In recent years, under the favor of improvements in biotechnology, the accessibility of the genetic data has increased and the genome-wide association studies, which scans whole genome, has came up. Genome-wide association studies enable us to analyze the whole genome, which includes approximately 1 million SNPs simultaneously in large samples, compared to the methods which are able to test only a few gene region. In the dissertation study, the advanced statistical methods, which reveal the relationships between genes and environmental factors in genetic epidemiology and can be used as a solution especially in the etiology of the complex diseases, are studied. In the study, a new model is proposed by considering the large scale genetic epidemiology studies especially obtained by next generation sequencing. In the dissertation study, firstly the genetic relationships are examined by analyzing the existence of the familial aggregation and a model named“Generalized Multi Stage Adjusted Latent Class Linear Mixed Model”is proposed for modeling the heterogeneous distributed phenotype and genetic information across the whole genome in the presence of both serial and familial correlations by considering detected complex relationship structures. In addition to this, the Generalized Estimating Equations method, which was developed as a solution in the presence of correlated data, is also upgraded for the multiple correlated structure of the data and used for the genetic association analysis of some candidate gene regions. The whole genome is analyzed by applying the proposed model to Genetic Analysis Workshop (GAW) data and the model results are compared to the results of standard models and literature. Moreover, the power of the model is discussed over the simulation data. As a result of model comparisons, the information criteria and the genomic control parameter are found smaller when compared to the standard model. In addition to this, the results of power analysis show that the proposed model is more powerful.
Benzer Tezler
- Genetik epidemiyolojide istatistiksel yaklaşımlar : Ailesel kümelenmede bir uygulama
Statistical methods in genetic epidemiology : An application for familial aggregation
SELEN BEGÜM UZUN
Yüksek Lisans
Türkçe
2016
BiyoistatistikÇukurova ÜniversitesiBiyoistatistik Ana Bilim Dalı
PROF. DR. HÜSEYİN REFİK BURGUT
- Bir ailenin primer enürezis noktürnalı bireylerindeki genetik değişimlerin araştırılması
Investigation of genetic changes in a family's individuals with primary enuresis nocturna
AYDENİZ AYDIN GÜMÜŞ
Tıpta Uzmanlık
Türkçe
2020
GenetikManisa Celal Bayar ÜniversitesiTıbbi Genetik Ana Bilim Dalı
PROF. DR. FETHİ SIRRI ÇAM
- Kars yöresindeki sığır, koyun ve insanlardan termofilik campylobacterlerin izolasyonu, identifikasyonu ve moleküler tiplendirilmesi.
Thermophlic campylobacters isolation, identification and molecular typing from cattle, ship and humans in Kars area.
SİNAN KARAKUŞ
Doktora
Türkçe
2011
MikrobiyolojiKafkas ÜniversitesiMikrobiyoloji (Veterinerlik) Ana Bilim Dalı
DOÇ. DR. AHMET ÜNVER
- Türkiye'deki intihar vakalarının mekânsal ve zamansal karakteristiklerinin sosyo-demografik ve ekonomik etmenlerle ilişkilerinin incelenmesi
Examining of the spatial and temporal characteristics of suicide cases in türkiye and their relationship with socio-demographic and economic factors
DUYGU ALTINSU CANBAZ
Yüksek Lisans
Türkçe
2024
Bilim ve Teknolojiİstanbul Teknik ÜniversitesiGeomatik Mühendisliği Ana Bilim Dalı
DOÇ. DR. AHMET ÖZGÜR DOĞRU