A tool for prediction of protein expression from genetic data
Genetik veriden protein ekspresyonu tahmini için bir araç
- Tez No: 691788
- Danışmanlar: PROF. DR. OSMAN UĞUR SEZERMAN
- Tez Türü: Yüksek Lisans
- Konular: Biyoistatistik, Biostatistics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2021
- Dil: İngilizce
- Üniversite: Acıbadem Mehmet Ali Aydınlar Üniversitesi
- Enstitü: Sağlık Bilimleri Enstitüsü
- Ana Bilim Dalı: Biyoistatistik ve Tıp Bilişimi Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 43
Özet
Proteinler, fizyolojik süreçte önemli roller oynayarak hücrenin düzgün işleyişinden sorumludur ve protein bolluğu, enzimatik reaksiyonları, protein-protein etkileşimini, yolakları doğrudan etkiler. Protein ekspresyonu, bakterilerden insanlara kadar tüm organizmalarda transkripsiyondan translasyona kadar her adımda hassas bir şekilde düzenlenen ve kontrol edilen karmaşık bir mekanizmadır. Hücre içindeki mutlak protein bolluğu sadece mRNA mevcudiyetine değil, aynı zamanda tRNA mevcudiyetine, çeviri hızına, birlikte çeviri katlanmasına, çeviri sonrası modifikasyonlara ve bozulma hızına da bağlıdır. Hücre içindeki mutlak protein seviyeleri çok dinamiktir ve çevresel ve biyolojik uyaranlardan etkilenir ve bu uyaranlar nedeniyle protein seviyelerindeki değişimin altında yatan mekanizmalar hala anlaşılamamıştır. Mevcut teknolojik gelişmeler, mRNA düzeylerinin dizileme tabanlı ölçümünün kolayca gerçekleştirilmesine yol açmaktadır; bununla birlikte, protein bolluğunu ölçmek için protokoller hala hem karmaşık hem de pahalıdır, hatta kütle spektrometrisinin protein havuzunu yakalamada sınırlamaları vardır. Protein bolluğu seviyesi, kodonun özelliklerine bağlı olan translasyon kinetiğinden etkilenir. Bu çalışmada, Saccharomyces cerevisiae verilerini kullanarak kodon ve tRNA özelliklerine dayalı olarak verilen kodlama dizisinden protein bolluk seviyesini tahmin etmek için makine öğrenme yaklaşımları geliştirdik. Kodon kullanımından frekans bilgisini sağlayan kodon özelliklerini hesapladık; ve tRNA uygunluğu indeksini hesapladık. Genin kodon sırasına bağlı olarak çeviri hızı hakkında bilgi toplamak için yeni geliştirilen Ribozom Akış Modeli'ni (RFM) kullandık. Bu özellikleri ve kodon kompozisyonunu kullanarak rastgele orman modeli, gradyan artırma makinesi ve destek vektör regresyon yaklaşımları geliştirdik ve son olarak performansı iyileştirmek için topluluk yöntemleri uyguladık ve eğitim verileri üzerindeki R2 değerini yaklaşık %6 artırdık ve tahmin sonuçları ve deneysel sonuçlar arasındaki Pearson korelasyon değerini 0.75 olarak bulduk.
Özet (Çeviri)
Proteins are responsible to function cell properly by playing important roles in physiological process and protein abundance directly affects the enzymatic reactions, protein-protein interaction, pathways. Protein expression is a complex mechanism that is finely regulated and controlled in every step from transcription to translation through all organisms. Absolute protein abundance within cell depends not only mRNA availability but also on tRNA availability, translation rate, co-translation folding, post-translational modifications, and degradation rate. Absolute protein levels within cell are very dynamic and influenced by environmental and biological stimuli and underlying mechanisms of change in protein levels because of these stimuli is not still understood. Current technological developments lead to sequencing-based measure of mRNA levels to perform easily; however, measuring protein abundance are still both complicated and expensive. Protein level within cell is influenced by translation kinetics which depend on features of codon. In this study, we developed machine learning approaches to predict protein abundance level from given coding sequence based on codon and tRNA features by using Saccharomyces cerevisiae data. We calculated codon features that enables the frequency information from codon usage and calculated tRNA availability features. We used newly developed Ribosome Flow Model (RFM) to capture information about translation rate depending on codon order of gene. By using these features and codon composition, we developed random forest model, gradient boosting machine, and support vector regression approaches and select the random forest model had better performance among other (R2=0.56). It gives correlation value between prediction results and experimental yield was 0.79.
Benzer Tezler
- Meme kanserli hastalarda neoadjuvan kemoterapiye yanıtın öngörülmesi ve değerlendirilmesi amacıyla bir nomogram geliştirilmesi
For the prediction and evaluation of neoadjuvant chemotherapy response in breast cancer patient: Development of a nomogram
SEZER GÖKÇEN
Tıpta Uzmanlık
Türkçe
2024
Genel CerrahiBolu Abant İzzet Baysal ÜniversitesiGenel Cerrahi Ana Bilim Dalı
PROF. DR. MEHMET HAYRİ ERKOL
DOÇ. DR. BAHRİ ÖZER
- Variant pathogenicity prediction tool based on protein-protein interactions and the effects of variants on 3-dimensional protein structure:a model for monogenic autoinflammatory disorders
Protein protein etkileşimlerini ve varyantların 3 boyutlu protein yapısındaki etkilerini esas alan varyant patojenite tahmini
ABDULLAH ALPER BÜLBÜL
Yüksek Lisans
İngilizce
2021
Biyoistatistikİstanbul Teknik ÜniversitesiMoleküler Biyoloji-Genetik ve Biyoteknoloji Ana Bilim Dalı
PROF. DR. EDA TAHİR TURANLI
- Characterization of C17orf45 as a novel target of the Wnt/B-catenin pathway
Wnt/B-katenin yolağının yeni hedef geni olarak C17orf45'in karakterize edilmesi
TUNCAY ŞEKER
Yüksek Lisans
İngilizce
2009
BiyolojiBoğaziçi ÜniversitesiMoleküler Biyoloji ve Genetik Ana Bilim Dalı
PROF. AHMET KOMAN
YRD. DOÇ. NECLA BİRGÜL İYİSON
- Constructing peptide (GEPI)-protein molecular hybrids by using genetic engineering methods for materials and medical applications.
Malzeme ve medikal uygulamalar için gen mühendisliği yoluyla peptid (GEPI)-protein hibritlerin oluşması.
DENİZ ŞAHİN
Doktora
İngilizce
2011
Biyomühendislikİstanbul Teknik Üniversitesiİleri Teknolojiler Ana Bilim Dalı
PROF. DR. CANDAN TAMERLER
PROF. DR. MEHMET SARIKAYA
- Computational approaches to study drug resistance mechanisms
İlaç direnç mekanizmaları için işlemsel yaklaşımlar
ZOYA KHALID
Doktora
İngilizce
2017
BiyolojiSabancı ÜniversitesiMoleküler Biyoloji-Genetik ve Biyomühendislik Ana Bilim Dalı
Prof. Dr. İSMAİL ÇAKMAK