Geri Dön

Inference of large-scale networks via statistical approaches

Geniş ölçekli ağların istatistiksel yaklaşımlarla tahmini

  1. Tez No: 582485
  2. Yazar: EZGİ AYYILDIZ DEMİRCİ
  3. Danışmanlar: PROF. DR. VİLDA PURUTÇUOĞLU GAZİ
  4. Tez Türü: Doktora
  5. Konular: İstatistik, Statistics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2019
  8. Dil: İngilizce
  9. Üniversite: Orta Doğu Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: İstatistik Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 91

Özet

Sistem biyolojisinde gen, protein gibi yapıların etkileşimleri bir ağ yapısı ile temsil edilebilir. Kompleks biyolojik sistemlerin moleküler mekanizmalarının anlaşılabilmesi için ağ yapılarının oluşturulması önemli bir rol oynar. Fakat bu ağların tahmini, yüksek boyutları ve seyrek yapıları sebebiyle zordur. Gaussian grafiksel modeli (GGM) yönsüz ağların oluşturulmasında sıklıkla kullanılan bir yöntemdir. Bu yöntem, bileşenler arasındaki etkileşimi çok değişkenli normallik varsayımı altında koşullu bağımlılık ile tanımlar. Fakat sistemin boyutları büyüdüğünde hesaplama zorluğu ile karşılaşılır ve GGM yönteminin güvenilirliği gözlemler normallikten uzaklaştıkça azalır. Bu çalışmada, bahsedilen problemlerin çözümü için GGM yöntemine alternatif olarak konik çok değişkenli uyarlamalı regresyon eğrilerinin (CMARS) kullanılmasını öneriyoruz. Bu yöntem, yüksek boyutlu ve ilişkili veriler için geliştirilen parametrik olmayan yöntemlerden biridir. CMARS'ı biyolojik sistemleri tanımlamak için uyarladık ve döngü temelli tanımı nedeniyle LCMARS olarak adlandırdık. Çalışmada farklı dağılımlar ve boyutlar altında çeşitli senaryolar üretilmiş ve LCMARS, MARS ve GGM yöntemlerinin performansları farklı doğruluk ölçüleri kullanılarak Monte Carlo simülasyonları ile karşılaştırılmıştır. Ek olarak, farklı gerçek biyolojik veri setleri bu yöntemlerin performanslarını gözlemlemek için kullanılmıştır. Ayrıca bu çalışmada, ağların modellenmesinden önce bir ön işlem adımı olarak çeşitli aykırı değer saptama yöntemlerinin kullanılmasının modelin doğruluğunu arttırıp arttırmadığı araştırılmıştır. Analizlerde çeşitli sentetik ve gerçek biyolojik veri setleri kullanılmaktadır.

Özet (Çeviri)

In system biology, the interactions between components such as genes, proteins, can be represented by a network. To understand the molecular mechanism of complex biological systems, construction of their networks plays a crucial role. However, estimation of these networks is a challenging problem because of their high dimensional and sparse structures. The Gaussian graphical model (GGM) is widely used approach to construct the undirected networks. GGM define the interactions between species by using the conditional dependencies of the multivariate normality assumption. However, when the dimension of the systems is high, the performance of the model becomes computationally demanding, and the accuracy of GGM decreases when the observations are far from normality. In this thesis, we suggest a conic multivariate adaptive regression splines (CMARS) as an alternative to GGM to overcome both problems. CMARS is one of the recent nonparametric methods developed for high dimensional and correlated data. We adapted CMARS to describe biological systems and called it“LCMARS”due to its loop-based description. Here, we generate various scenarios based on distinct distributions and dimensions to compare the performance of LCMARS with MARS and GGM in terms of accuracy measures via Monte Carlo runs. Additionally, different real biological datasets are used to observe the performance of underlying methods. Furthermore, in this study, we perform various outlier detection methods as a pre-processing step before modeling the networks in order to investigate whether the outlier detection can improve the accuracy of the model. In the analysis, several synthetic and real benchmark biological datasets are used.

Benzer Tezler

  1. Büyük ölçekli atmosferik dolanım ile hidrolojik kuraklık incelenmesi

    Investigation of hydrological drought with large-scale atmospheric circulation

    MOHAMED ABDELKADER

    Yüksek Lisans

    Türkçe

    Türkçe

    2021

    İnşaat MühendisliğiEge Üniversitesi

    İnşaat Mühendisliği Ana Bilim Dalı

    DOÇ. DR. CAHİT YERDELEN

  2. Cumhurı̇yet Dönemı̇ basınında (1928 - 2000) harı̇ta ı̇çerı̇klerı̇nı̇n kartografı̇k yönden araştırılması, arşı̇vlenmesı̇, sınıflandırılması

    Archiving, classification and research on map contents according to cartographic approach in press of the period (1928-2000) of Turkish Republic

    PINAR SARIN

    Doktora

    Türkçe

    Türkçe

    2021

    Jeodezi ve Fotogrametriİstanbul Teknik Üniversitesi

    Geomatik Mühendisliği Ana Bilim Dalı

    PROF. DR. NESİBE NECLA ULUĞTEKİN

  3. Normalizing flows for bayesian statistical inference posterioranalysis

    Bayesian istatistiksel çıkarım sonsal analizi için normalleştirme akımları

    KUTAY NAZLI

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Pomona College California

    Astronomi ve Astrofizik Ana Bilim Dalı

    DR. ELENA SELLENTİN

  4. New statistical downscaling methods and applications for Turkey

    Yeni istatistiksel ölçek küçültme yöntemleri ve Türkiye için uygulamalar

    HASAN TATLI

    Doktora

    İngilizce

    İngilizce

    2004

    Meteorolojiİstanbul Teknik Üniversitesi

    Meteoroloji Mühendisliği Ana Bilim Dalı

    PROF.DR. NÜZHET DALFES

    Y.DOÇ.DR. SİBEL MENTEŞ

  5. Ortometrik yüksekliklerin dolaylı olarak GPS gözlemlerinden elde edilmesinde kullanılan yöntemlerin irdelenmesi

    Investigation of the methods used to derive indirectly orthometric height from GPS measurements

    LEYLA ÇAKIR

    Doktora

    Türkçe

    Türkçe

    2012

    Jeodezi ve FotogrametriKaradeniz Teknik Üniversitesi

    Jeodezi ve Fotogrametri Mühendisliği Ana Bilim Dalı

    PROF. DR. KEMAL ŞEN