Yapay Öğrenme ile gen dizilimindeki eksik verinin tamamlanması
Imputation of genome sequences using Machine Learning
- Tez No: 532149
- Danışmanlar: DR. ÖĞR. ÜYESİ ALİ OSMAN ÇIBIKDİKEN
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2018
- Dil: Türkçe
- Üniversite: Necmettin Erbakan Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Endüstri Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 63
Özet
Canlıların DNA dizilimleri büyük oranda aynıdır. DNA dizilimi içerisinde polimorfik özellik gösteren farklı alt dizilim bölgeleri ise aynı türe sahip bireylerin birbirinden farklı olan yönlerini kodlar. Bireye göre polimorfik özellik gösteren alt dizilimlerin toplamı ilgili bireyin genotipini oluşturur. Hücre örneklerinden genetik materyalin elde edilmesi ve elde edilen genetik materyalden de genotip verisinin elde edilme sürecinde cihaz hassasiyeti kaynaklı kayıp veri problemi ile karşılaşılmaktadır. Eldeki genotip verisi üzerinde kayıp veri bölgelerinin bulunması ise genetik araştırmaları kötü yönde etkilemektedir. Kayıp veri bölgelerine sahip genotip verileri üzerinde yüksek başarımlı analizler gerçekleştirilememektedir. Bundan kaynaklanan istatistiksel eksiklikler genetik haritalamayı imkansız hale getirdiği için fenotipik özelliklerin veya herhangi bir hastalığın genetik arka planı bulunamamaktadır. Tüm bu sebeplerden dolayı kayıp verilerin tamamlanması, biyoenformatik analizlerin en temel gerekliliği haline gelmektedir. Genotip verisi üzerinde kayıp veri tahmini işlemini gerçekleştirebilmek için farklı istatistiksel modeller kullanılmakla birlikte en çok kullanılan istatistiksel model, Markov zincirleri olmuştur. Markov zincirleriyle yüksek başarımlı kayıp veri tahmini yapılabilmektedir. Çalışmada Markov zincirleriyle yapılan çalışmalar incelenmiş olup, patlıcan türündeki bireylere ait kayıp veri bölgeleri içeren genotip verisi üzerinde uygulanmış olup aynı veri üzerinde kayıp veri tahmini işleminin yapay öğrenme algoritmalarıyla gerçekleştirilmesi araştırılıp aynı patlıcan genotip veri seti üzerinde uygulanmıştır.
Özet (Çeviri)
DNA sequences of living organisms are substantially equivalent. Polymorphic subsequence regions on DNA sequence define different from another attribute of same kind of individuals. Genotype consist of this polymorphic subsequences. Obtaining genetic material from cell samples and obtaining genotype data from obtained genetic material is encountered with lost data problem. The discovery of missing data regions on the existing genotype data is affecting the genetic researches in the worst way. Analysis is impossible on genotype data that contains missing subsequence region. Since genetic mapping can not be performed, the disease genetic relationship can not be established today. The most commonly used statistical model is the Markov chains, although different statistical models are used to perform the loss estimation on the genotype data. Markov chains can predict high performance loss data. In the study, Markov chain and machine learning based imputation methods are researched and estimation of lost data was performed by using deep learning methods on genotype data of eggplant tuna.
Benzer Tezler
- Efficient machine learning models for cancer biology
Kanser biyolojisi için etkin yapay öğrenme modelleri
AYYÜCE BEGÜM BEKTAŞ
Doktora
İngilizce
2022
Endüstri ve Endüstri MühendisliğiKoç ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
DOÇ. DR. MEHMET GÖNEN
- Ağ verisi üzerinde ilgili ve rastgele alt uzaylar seçerek birlikte öğrenme
Relevant and random subspaces for co-training in networked data
KADRİYE BAĞLIOĞLU
Yüksek Lisans
Türkçe
2013
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. ZEHRA ÇATALTEPE
- Efficient optimization algorithms for computational biology
Hesaplamalı biyolojide etkin eniyileme algoritmaları
OĞUZ CAN BİNATLI
Doktora
İngilizce
2024
Endüstri ve Endüstri MühendisliğiKoç ÜniversitesiEndüstri Mühendisliği ve Operasyon Yönetimi
PROF. DR. MEHMET GÖNEN
- Gmo detection with nanobiosensing system integration of artificial intelligence
Yapay zekânın entegre edildiği nanobiyosensör sistemiyle gdo tayini
YEŞİM TAŞKIN
Yüksek Lisans
İngilizce
2022
Gıda MühendisliğiHacettepe ÜniversitesiGıda Mühendisliği Ana Bilim Dalı
PROF. DR. REMZİYE YILMAZ
PROF. DR. BRAD DAY
- Yapay öğrenme bazlı hesaplamalı modelleme ile geniş çaplı kanser hücre hattı ilaç yanıt tahmini
Comprehensive cancer cell line drug response prediction by machine learning based computational modelling
UMUT ONUR ÖZCAN
Yüksek Lisans
Türkçe
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHacettepe ÜniversitesiBiyoenformatik Ana Bilim Dalı
DOÇ. DR. TUNCA DOĞAN