Kimyasalların gen düzenleyici etkilerinin tahmini için transfer öğrenimi
Transfer learning for predicting gene regulatory effects of chemicals
- Tez No: 752640
- Danışmanlar: DOÇ. DR. MEHMET TAN
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2022
- Dil: Türkçe
- Üniversite: TOBB Ekonomi ve Teknoloji Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 60
Özet
Kemogenomik, ilaç tasarımına ve taramaya yardımcı olmak amacıyla biyolojik hedeflerin kimyasal bileşiklere genomik ve/veya proteomik reaksiyonunun incelenmesidir. Kemogenomikteki birçok zorluktan biri, gerçek yaşam deney verilerine bağımlılıktan kaynaklanmaktadır; farklı kimyasal bileşiklerin ve ilaç hedeflerinin kombinasyonu, gerçekçi olmayan sayıda olası deney yaratır ve bu da belirli kimyasallara ve hedeflere yönelik önyargılı veri kümeleriyle sonuçlanmaktadır. Yapay öğrenmedeki son gelişmeler, bu veri kümelerinin sınırlarını kolayca zorlayan güçlü modellerin aşırı doygunluğuyla sonuçlanmıştır. Bu yatkınlıkların etkilerini nötrlemek için, benzer problemlerden bilgi edinme yöntemi olan transfer öğrenmeyi kullanmaktayız. Kemogenomik veri setlerindeki en önemli yanlılık, ilaç hedeflerine yönelik olandır. Bazı hücre dizilerinin erişebilirliği ve önemi, bu deneyler için bir ilaç hedefi olarak kullanılma şansını büyük ölçüde artırırken, diğerlerinin yapay öğrenme modellerini eğitmek için ancak yeterli verisi vardır. Derin Bileşik Profil Oluşturucu (DeepCOP) üzerinde yapılan çalışmayı temel olarak kullanırken, transfer öğreniminin, çeşitli ilaç hedeflerinin eğitilebilirliğini büyük ölçüde artırdığını deneysel olarak göstermekteyiz. Deneyler için kullanılan model yapısı değiştirilmemiştir. DeepCOP'da kullanılan veri bölme yöntemine ek olarak iki yöntem daha eklenmiştir. Deneylerimiz transfer öğrenmenin basit yöntemlerinden biri olan parametre tabanlı transfer öğrenimine odaklanırken, ROC eğrisi altında kalan alan puanlarında \%22,81'e varan ve ortalama \%9,00 iyileşme göstermiştir; bununla birlikte hiperparametre optimizasyonu uygulandığı ve transfer kaynağı olarak doğru hücre hattı seçildiğinde bu iyileşmelerin arttırılabileceğine yönelik potansiyel göstermiştir.
Özet (Çeviri)
Chemogenomics is the study of the genomic and/or proteomic reaction of biological targets to chemical compounds, with the goal of aiding drug design and screening. One of the many difficulties in chemogenomics comes from the dependency on real-life experiment data; the combination of different chemical compounds and drug targets creates an unrealistic number of possible experiments, which results in datasets that are biased towards certain chemicals and targets. The recent developments in machine learning resulted in an over-saturation of powerful models that easily pushed the limits of these datasets. To undo the effects of these biases, we employ transfer learning, the method of leveraging knowledge from similar problems. The most important bias of chemogenomics datasets is the bias towards drug targets. The availability and significance of certain cell lines greatly increase the chance of it being used as a drug target for these experiments, while others have barely enough data to train machine learning models. We experimentally demonstrate that transfer learning greatly increases the trainability of various drug targets, while using the work done on the Deep Compound Profiler (DeepCOP) as a basis. While focused on one of the simple methods of transfer learning, our experiments showed up to 22.81\% and an average of 9.00\% improvement on the area under ROC curve scores and showed great potential to be improved upon if accompanied by hyperparameter optimization and correct cell line as the transfer source.
Benzer Tezler
- Investigation of physiological roles of strigolactones in sugar beet (Beta vulgaris L.) under in vitro tissue culture and ex vitro abiotic stress conditions
Strigolaktonlarin şeker pancarinda (Beta vulgaris L.) fizyolojik etkilerinin in vitro doku kültürü ve ex vitro abiyotik stres koşullari altinda i̇ncelenemsi
FATEMEH AFLAKI
Doktora
İngilizce
2019
BiyolojiBolu Abant İzzet Baysal ÜniversitesiBiyoloji Ana Bilim Dalı
PROF. DR. EKREM GÜREL
- Comparative whole genome sequencing and bioinformatic analysis of afreeze-thaw stress-resistant, industrial Saccharomyces cerevisiae strain
Donma-erime stresine dirençli bir endüstriyel Saccharomyces cerevisiae suşunun karşılaştırmalı tüm genom dizileme ve biyoinformatik analizi
BURCU TUĞBA ŞİMŞEK
Yüksek Lisans
İngilizce
2022
Biyoteknolojiİstanbul Teknik ÜniversitesiMoleküler Biyoloji-Genetik ve Biyoteknoloji Ana Bilim Dalı
PROF. DR. ZEYNEP PETEK ÇAKAR
- Investigation of the effects of abrb and cody deletions on the bacilysin overproducer B. subtilis HWA strain
AbrB ve CodY yokluğunun basilisin yüksek üreticisi B. subtilis HWA suşundaki etkilerinin incelenmesi
GÖKSU TARTAR
Yüksek Lisans
İngilizce
2024
Biyoteknolojiİstanbul Teknik ÜniversitesiMoleküler Biyoloji-Genetik ve Biyoteknoloji Ana Bilim Dalı
PROF. DR. AYTEN KARATAŞ
- Optimization and use of DNA sequencing by capillary electrophoresis for comparative yeast genotype analysis
Kapiler elektroforezine dayalı DNA dizileme yönteminin optimizasyonu ve mayada karşılaştırmalı genotip analizi için kullanılması
CİHAN ERDİNÇ GÜLSEV
Yüksek Lisans
İngilizce
2014
Biyoteknolojiİstanbul Teknik ÜniversitesiMoleküler Biyoloji-Genetik ve Biyoteknoloji Ana Bilim Dalı
PROF. DR. ZEYNEP PETEK ÇAKAR
- Characterization of the yvfI mutant spores
yvfI mutant sporlarının karakterizasyonu
EZGİ ARSLAN
Yüksek Lisans
İngilizce
2010
Biyoteknolojiİstanbul Teknik Üniversitesiİleri Teknolojiler Ana Bilim Dalı
DOÇ. DR. AYTEN YAZGAN KARATAŞ