Cost and benefit analysis of features used in machine learning based pre-miRNA detection
Makine öğrenimine dayalı öncül miRNA tespitinde kullanılan özelliklerin fayda ve maliyet analizi
- Tez No: 449142
- Danışmanlar: DOÇ. DR. JENS ALLMER
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Biyoistatistik, Biyoloji, Computer Engineering and Computer Science and Control, Biostatistics, Biology
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2016
- Dil: İngilizce
- Üniversite: İzmir Yüksek Teknoloji Enstitüsü
- Enstitü: Mühendislik ve Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Moleküler Biyoloji ve Genetik Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 89
Özet
Gen ifadesinin post-transkripsiyonel regülasyonunda önemli bir rolü olan kısa RNA moleküller mikroRNAlardır (miRNA). Transkripsionlarını iki RNAIII endonükleaz işlemi takip eder ve olgun miRNA oluşumuyla RISC-kompleksi mRNA hedeflemesini başlatır. Deneysel miRNA tahmini zordur çünkü miRNA ifadesni belirleme işlemi birçok faktöre dayanır bu yüzden bilişimsel metotlar daha umut vericidir. Genomdaki diğer saç tokası yapılarından (hairpin) ayırt edebilmek ve miRNA tespiti için, miRNAların karakteristik özellikleri tanımlanmalıdır. Bu sebeple, Veri Madenciliği metodları öncül miRNA (pre-miRNA) özelliklerini temel alır. Bu çalışmada 800den fazla pre-miRNA özelliğinin maliyet ve yarar analizi yapılmıştır. Bilgi kazanımı skoru özelliğin ne kadar ayırt edici olduğunu, Linear Korelasyon katsayısı özelliklerin birbirleriyle nasıl bağlı olduğunu ve zaman ölçümü de bir özelliğin ne kadar bilişimsel maliyetinin olduğunu gösterir. Sonuç- lardan yavaş olmayan ve bilgi verici beş özellik (assl, lsr(%bp), lscm, asal and hpmfe rfI3) (dört yapısal ve bir yapısal-enerjik) seçildi ve birbiriyle korelasyonları olmadığı görüldü. Analizler insan hairpin, sözde (pseudo) veri ve kızamık (measles) virüsü, Measles İnsan KEGG Patikası genleri ile yapılmıştır. İnsan hairpin ve measles virüsünün genel hesaplanması Amazon serverında yaklaşık olarak 2 USD (Amerikan Doları) tutmuştur. Gözetimli öğrenme ve Rastgele Orman karar ağacı Veri Madenciliği kullanılarak iki measles KEGG patikası geninden (TAB2 and BCC3) üç miRNA tahmin edilmiştir. Bunlarda olgun miRNA dizlileri gömülü bulunmuştur.
Özet (Çeviri)
MicroRNAs (miRNAs) are short RNA molecules which play important roles in the post-trancriptional regulation of gene expression. Their transcription is followed by two RNA III endonuclease processing steps leading to mature miRNA formation. They are then incorporated into the RISC-complex which mediates mRNA targeting. Exper- imental miRNA prediction is difficult since detection relies on many factors therefore, computational methods have become indispensable. Therefore, machine learning meth- ods rely on features describing precursor-miRNAs (pre-miRNAs) to be able to differenti- ate them from other hairpins in a genome. It is important to define feature groups which are informative, not highly correlated, and don't incur a large computational cost in or- der to facilitate accurate miRNA detection. In this study for more than 800 pre-miRNA features the computational cost and benefit was analyzed. From these analyses five fea- tures (assl, lsr(%bp), lscm, asal and hpmfe rf I3), (four structural and one structural- thermodynamic one), which aren't correlated, informative and are not computationally expensive are noticeable. Analyses are done with human hairpins, pseudo data; and a case study using the measles virus and the measles KEGG pathway genes. Overall cal- culation of human hairpins and measles virus took approximately 2 USD (United States Dollar) on Amazon web services. Supervised learning and random forest machine learn- ing for miRNA prediction was applied and to two genes (TAB2 and BCC3) within the measles KEGG pathway and three hairpins were predicted. They were found to have human mature miRNA sequences embedded in them and their already annotated targets helped enlarge the KEGG measles pathway.
Benzer Tezler
- Borsa istanbul (BIST) hisse fiyat değişim yönünün ilişkisel borsa ağı kullanılarak tahmin edilmesi
Forecasting stock price change direction using relational stock market network on borsa Istanbul (BIST)
BİRCAN ERGÜR
Yüksek Lisans
Türkçe
2014
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. ZEHRA ÇATALTEPE
- Time series classification via topological data analysis
Topolojik veri analizi ile zaman serilerinin sınıflandırılması
ALPEREN KARAN
Doktora
İngilizce
2022
Matematikİstanbul Teknik ÜniversitesiMatematik Mühendisliği Ana Bilim Dalı
PROF. DR. ATABEY KAYGUN
- Customer churn analysis based on machine learning by using data mining techniques in telecommunication sector
Telekomünikasyon sektöründe veri madencilik tekniklerini kullanarak makine öğrenmesine dayalı müşteri terk analizi
ELİF ÇELİK
Yüksek Lisans
İngilizce
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolYeditepe ÜniversitesiYönetim Bilişim Sistemleri Ana Bilim Dalı
DOÇ. DR. AŞKIN DEMİRAĞ
- İklimlendirme sistemleri üzerinde makine öğrenmesi ile anomali tespiti
Anomaly detection with machine learning on air conditioning systems
REFİK KİBAR
Yüksek Lisans
Türkçe
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSakarya ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ MUHAMMED FATİH ADAK
DR. ÖĞR. ÜYESİ KEVSER OVAZ AKPINAR
- Bankacılık sektöründe dış kaynak çalışan yönetiminin iyileştirilmesinde bilgi teknolojileri kullanımına yönelik bir uygulama
An application to use information technologies to improve management of outsourced employee in the banking industry
SEREN AKBABA
Yüksek Lisans
Türkçe
2022
İşletmeİstanbul Teknik Üniversitesiİşletme Mühendisliği Ana Bilim Dalı
DOÇ. DR. NİHAN YILDIRIM