Geri Dön

A tool for prediction of protein expression from genetic data

Genetik veriden protein ekspresyonu tahmini için bir araç

  1. Tez No: 691788
  2. Yazar: SILA GERLEVİK
  3. Danışmanlar: PROF. DR. OSMAN UĞUR SEZERMAN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Biyoistatistik, Biostatistics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2021
  8. Dil: İngilizce
  9. Üniversite: Acıbadem Mehmet Ali Aydınlar Üniversitesi
  10. Enstitü: Sağlık Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Biyoistatistik ve Tıp Bilişimi Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 43

Özet

Proteinler, fizyolojik süreçte önemli roller oynayarak hücrenin düzgün işleyişinden sorumludur ve protein bolluğu, enzimatik reaksiyonları, protein-protein etkileşimini, yolakları doğrudan etkiler. Protein ekspresyonu, bakterilerden insanlara kadar tüm organizmalarda transkripsiyondan translasyona kadar her adımda hassas bir şekilde düzenlenen ve kontrol edilen karmaşık bir mekanizmadır. Hücre içindeki mutlak protein bolluğu sadece mRNA mevcudiyetine değil, aynı zamanda tRNA mevcudiyetine, çeviri hızına, birlikte çeviri katlanmasına, çeviri sonrası modifikasyonlara ve bozulma hızına da bağlıdır. Hücre içindeki mutlak protein seviyeleri çok dinamiktir ve çevresel ve biyolojik uyaranlardan etkilenir ve bu uyaranlar nedeniyle protein seviyelerindeki değişimin altında yatan mekanizmalar hala anlaşılamamıştır. Mevcut teknolojik gelişmeler, mRNA düzeylerinin dizileme tabanlı ölçümünün kolayca gerçekleştirilmesine yol açmaktadır; bununla birlikte, protein bolluğunu ölçmek için protokoller hala hem karmaşık hem de pahalıdır, hatta kütle spektrometrisinin protein havuzunu yakalamada sınırlamaları vardır. Protein bolluğu seviyesi, kodonun özelliklerine bağlı olan translasyon kinetiğinden etkilenir. Bu çalışmada, Saccharomyces cerevisiae verilerini kullanarak kodon ve tRNA özelliklerine dayalı olarak verilen kodlama dizisinden protein bolluk seviyesini tahmin etmek için makine öğrenme yaklaşımları geliştirdik. Kodon kullanımından frekans bilgisini sağlayan kodon özelliklerini hesapladık; ve tRNA uygunluğu indeksini hesapladık. Genin kodon sırasına bağlı olarak çeviri hızı hakkında bilgi toplamak için yeni geliştirilen Ribozom Akış Modeli'ni (RFM) kullandık. Bu özellikleri ve kodon kompozisyonunu kullanarak rastgele orman modeli, gradyan artırma makinesi ve destek vektör regresyon yaklaşımları geliştirdik ve son olarak performansı iyileştirmek için topluluk yöntemleri uyguladık ve eğitim verileri üzerindeki R2 değerini yaklaşık %6 artırdık ve tahmin sonuçları ve deneysel sonuçlar arasındaki Pearson korelasyon değerini 0.75 olarak bulduk.

Özet (Çeviri)

Proteins are responsible to function cell properly by playing important roles in physiological process and protein abundance directly affects the enzymatic reactions, protein-protein interaction, pathways. Protein expression is a complex mechanism that is finely regulated and controlled in every step from transcription to translation through all organisms. Absolute protein abundance within cell depends not only mRNA availability but also on tRNA availability, translation rate, co-translation folding, post-translational modifications, and degradation rate. Absolute protein levels within cell are very dynamic and influenced by environmental and biological stimuli and underlying mechanisms of change in protein levels because of these stimuli is not still understood. Current technological developments lead to sequencing-based measure of mRNA levels to perform easily; however, measuring protein abundance are still both complicated and expensive. Protein level within cell is influenced by translation kinetics which depend on features of codon. In this study, we developed machine learning approaches to predict protein abundance level from given coding sequence based on codon and tRNA features by using Saccharomyces cerevisiae data. We calculated codon features that enables the frequency information from codon usage and calculated tRNA availability features. We used newly developed Ribosome Flow Model (RFM) to capture information about translation rate depending on codon order of gene. By using these features and codon composition, we developed random forest model, gradient boosting machine, and support vector regression approaches and select the random forest model had better performance among other (R2=0.56). It gives correlation value between prediction results and experimental yield was 0.79.

Benzer Tezler

  1. Meme kanserli hastalarda neoadjuvan kemoterapiye yanıtın öngörülmesi ve değerlendirilmesi amacıyla bir nomogram geliştirilmesi

    For the prediction and evaluation of neoadjuvant chemotherapy response in breast cancer patient: Development of a nomogram

    SEZER GÖKÇEN

    Tıpta Uzmanlık

    Türkçe

    Türkçe

    2024

    Genel CerrahiBolu Abant İzzet Baysal Üniversitesi

    Genel Cerrahi Ana Bilim Dalı

    PROF. DR. MEHMET HAYRİ ERKOL

    DOÇ. DR. BAHRİ ÖZER

  2. Variant pathogenicity prediction tool based on protein-protein interactions and the effects of variants on 3-dimensional protein structure:a model for monogenic autoinflammatory disorders

    Protein protein etkileşimlerini ve varyantların 3 boyutlu protein yapısındaki etkilerini esas alan varyant patojenite tahmini

    ABDULLAH ALPER BÜLBÜL

    Yüksek Lisans

    İngilizce

    İngilizce

    2021

    Biyoistatistikİstanbul Teknik Üniversitesi

    Moleküler Biyoloji-Genetik ve Biyoteknoloji Ana Bilim Dalı

    PROF. DR. EDA TAHİR TURANLI

  3. Characterization of C17orf45 as a novel target of the Wnt/B-catenin pathway

    Wnt/B-katenin yolağının yeni hedef geni olarak C17orf45'in karakterize edilmesi

    TUNCAY ŞEKER

    Yüksek Lisans

    İngilizce

    İngilizce

    2009

    BiyolojiBoğaziçi Üniversitesi

    Moleküler Biyoloji ve Genetik Ana Bilim Dalı

    PROF. AHMET KOMAN

    YRD. DOÇ. NECLA BİRGÜL İYİSON

  4. Constructing peptide (GEPI)-protein molecular hybrids by using genetic engineering methods for materials and medical applications.

    Malzeme ve medikal uygulamalar için gen mühendisliği yoluyla peptid (GEPI)-protein hibritlerin oluşması.

    DENİZ ŞAHİN

    Doktora

    İngilizce

    İngilizce

    2011

    Biyomühendislikİstanbul Teknik Üniversitesi

    İleri Teknolojiler Ana Bilim Dalı

    PROF. DR. CANDAN TAMERLER

    PROF. DR. MEHMET SARIKAYA

  5. Computational approaches to study drug resistance mechanisms

    İlaç direnç mekanizmaları için işlemsel yaklaşımlar

    ZOYA KHALID

    Doktora

    İngilizce

    İngilizce

    2017

    BiyolojiSabancı Üniversitesi

    Moleküler Biyoloji-Genetik ve Biyomühendislik Ana Bilim Dalı

    Prof. Dr. İSMAİL ÇAKMAK