Geri Dön

Yapay Öğrenme ile gen dizilimindeki eksik verinin tamamlanması

Imputation of genome sequences using Machine Learning

  1. Tez No: 532149
  2. Yazar: MİTHAT RAŞİT ÖZÇIKRIKCI
  3. Danışmanlar: DR. ÖĞR. ÜYESİ ALİ OSMAN ÇIBIKDİKEN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2018
  8. Dil: Türkçe
  9. Üniversite: Necmettin Erbakan Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Endüstri Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 63

Özet

Canlıların DNA dizilimleri büyük oranda aynıdır. DNA dizilimi içerisinde polimorfik özellik gösteren farklı alt dizilim bölgeleri ise aynı türe sahip bireylerin birbirinden farklı olan yönlerini kodlar. Bireye göre polimorfik özellik gösteren alt dizilimlerin toplamı ilgili bireyin genotipini oluşturur. Hücre örneklerinden genetik materyalin elde edilmesi ve elde edilen genetik materyalden de genotip verisinin elde edilme sürecinde cihaz hassasiyeti kaynaklı kayıp veri problemi ile karşılaşılmaktadır. Eldeki genotip verisi üzerinde kayıp veri bölgelerinin bulunması ise genetik araştırmaları kötü yönde etkilemektedir. Kayıp veri bölgelerine sahip genotip verileri üzerinde yüksek başarımlı analizler gerçekleştirilememektedir. Bundan kaynaklanan istatistiksel eksiklikler genetik haritalamayı imkansız hale getirdiği için fenotipik özelliklerin veya herhangi bir hastalığın genetik arka planı bulunamamaktadır. Tüm bu sebeplerden dolayı kayıp verilerin tamamlanması, biyoenformatik analizlerin en temel gerekliliği haline gelmektedir. Genotip verisi üzerinde kayıp veri tahmini işlemini gerçekleştirebilmek için farklı istatistiksel modeller kullanılmakla birlikte en çok kullanılan istatistiksel model, Markov zincirleri olmuştur. Markov zincirleriyle yüksek başarımlı kayıp veri tahmini yapılabilmektedir. Çalışmada Markov zincirleriyle yapılan çalışmalar incelenmiş olup, patlıcan türündeki bireylere ait kayıp veri bölgeleri içeren genotip verisi üzerinde uygulanmış olup aynı veri üzerinde kayıp veri tahmini işleminin yapay öğrenme algoritmalarıyla gerçekleştirilmesi araştırılıp aynı patlıcan genotip veri seti üzerinde uygulanmıştır.

Özet (Çeviri)

DNA sequences of living organisms are substantially equivalent. Polymorphic subsequence regions on DNA sequence define different from another attribute of same kind of individuals. Genotype consist of this polymorphic subsequences. Obtaining genetic material from cell samples and obtaining genotype data from obtained genetic material is encountered with lost data problem. The discovery of missing data regions on the existing genotype data is affecting the genetic researches in the worst way. Analysis is impossible on genotype data that contains missing subsequence region. Since genetic mapping can not be performed, the disease genetic relationship can not be established today. The most commonly used statistical model is the Markov chains, although different statistical models are used to perform the loss estimation on the genotype data. Markov chains can predict high performance loss data. In the study, Markov chain and machine learning based imputation methods are researched and estimation of lost data was performed by using deep learning methods on genotype data of eggplant tuna.

Benzer Tezler

  1. Efficient machine learning models for cancer biology

    Kanser biyolojisi için etkin yapay öğrenme modelleri

    AYYÜCE BEGÜM BEKTAŞ

    Doktora

    İngilizce

    İngilizce

    2022

    Endüstri ve Endüstri MühendisliğiKoç Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    DOÇ. DR. MEHMET GÖNEN

  2. Ağ verisi üzerinde ilgili ve rastgele alt uzaylar seçerek birlikte öğrenme

    Relevant and random subspaces for co-training in networked data

    KADRİYE BAĞLIOĞLU

    Yüksek Lisans

    Türkçe

    Türkçe

    2013

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ZEHRA ÇATALTEPE

  3. Efficient optimization algorithms for computational biology

    Hesaplamalı biyolojide etkin eniyileme algoritmaları

    OĞUZ CAN BİNATLI

    Doktora

    İngilizce

    İngilizce

    2024

    Endüstri ve Endüstri MühendisliğiKoç Üniversitesi

    Endüstri Mühendisliği ve Operasyon Yönetimi

    PROF. DR. MEHMET GÖNEN

  4. Gmo detection with nanobiosensing system integration of artificial intelligence

    Yapay zekânın entegre edildiği nanobiyosensör sistemiyle gdo tayini

    YEŞİM TAŞKIN

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Gıda MühendisliğiHacettepe Üniversitesi

    Gıda Mühendisliği Ana Bilim Dalı

    PROF. DR. REMZİYE YILMAZ

    PROF. DR. BRAD DAY

  5. Yapay öğrenme bazlı hesaplamalı modelleme ile geniş çaplı kanser hücre hattı ilaç yanıt tahmini

    Comprehensive cancer cell line drug response prediction by machine learning based computational modelling

    UMUT ONUR ÖZCAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHacettepe Üniversitesi

    Biyoenformatik Ana Bilim Dalı

    DOÇ. DR. TUNCA DOĞAN