Geri Dön

Genomik veri tabanlarında metin tabanlı deney geri getirimi

Text-based experiment retrieval in genomic databases

  1. Tez No: 714914
  2. Yazar: SELEN BAŞAK
  3. Danışmanlar: DR. ÖĞR. ÜYESİ DUYGU DEDE ŞENER
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2021
  8. Dil: Türkçe
  9. Üniversite: Başkent Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
  13. Sayfa Sayısı: 71

Özet

Genomik veriden biyolojiksel bilginin çıkarımı biyoinformatik alanında oldukça önemlidir. Genomik veri deneysel ölçümler, sekans verileri, network olmak üzere farklı veri formatlarında saklanmaktadır. Bu veri yapılarının GEO (Gene Expression Omnibus), ArrayExpress ve GenBank gibi veri tabanlarında hızla artan miktarları ile birlikte doğru ve ilgili veriye ulaşmak önemli bir konu haline gelmiştir. Çalışmada veri tabanlarının deney benzerliklerini bulma yetersizliğinin giderilmesi amacı ile genomik veri tabanlarından ilgili deneylerin geri getirimi için metin tabanlı bir geri getirim alt yapısı geliştirilmesi hedeflenmiştir. Geliştirilen alt yapıda sözcük tabanlı (lexical) ve anlam (semantic) tabanlı benzerlik bulma yöntemleri kullanılıp, yöntem performansları kıyaslanmıştır. Sözcük tabanlı yöntem olarak Jaccard benzerlik metriği kullanılırken, anlam tabanlı benzerlik yöntemleri olarak Latent Semantic Analysis (LSA), Probabilistic Latent Semantic Analysis (PLSA) ve Latent Dirichlet Allocation (LDA) yöntemleri kullanılmıştır. Bildiğimiz kadarıyla, bu çalışma ilk kez anlamsal benzerlik yöntemlerini zaman serisi mikrodizi deneylerinin geri getiriminde kullanan çalışmadır. Sistem performansı, GEO veri tabanından alınan Arabidopsis Thaliana bitkisine ait 120 farklı zaman serisi deneyinin açıklama metinleri ile test edilmiş ve elde edilen deneysel sonuçların biyolojiksel ve istatiksel anlamlılıkları doğrulanmıştır. Sonuçlara göre anlam tabanlı yöntemlerin ilgili deneyleri tespit etmede sözcük ve içerik-tabanlı geri getirim yöntemlerine göre daha başarılı olduğu gözlemlenmiştir. Geliştirilen sistemin mevcut deney geri getirim alt yapılarına göre daha başarılı performans elde etmesi ile gelecek çalışmalara ışık tutması beklenmektedir. Aynı zamanda geliştirilen alt yapı farklı türdeki genomik verilerin benzerliklerini bulmak için kolaylıkla uyarlanabilecek bir sistemdir.

Özet (Çeviri)

Extraction of biological information from genomic data is very important in the field of bioinformatics. Genomic data is stored in different data formats such as experimental measurements, sequence data and network. With the rapid growth of these data structures in databases such as GEO (Gene Expression Omnibus), ArrayExpress and GenBank, reaching accurate and relevant data has become an important issue. In thisstudy, it is aimed to develop a text-based experiment retrieval framework for the retrieval of relevant experiments from genomic databases. In the proposed framework, Jaccard similarity metric was used as a lexical similarity method, Latent Semantic Analysis (LSA), Probabilistic Latent Semantic Analysis (PLSA) and Latent Dirichlet Allocation (LDA) methods were used as semantic similarity methods. To the best of our knowledge, this is the first study to use semantic similarity methods in the retrieval of time-series microarray experiments. The system performance was tested with the textual information of 120 different time series experiments of Arabidopsis Thaliana plant obtained from the GEO database. With the biological and statistical significance tests, obtained results were verified. As a result, it was observed that semantic similarity approaches were more successful than text-based and content-based retrieval methods in identifying relevant experiments. It is expected that the developed system will shed light on future studies by achieving a successful performance in retrieving relevant experiments. Moreover, the framework can be easily adapted to different types of genomic data.

Benzer Tezler

  1. Experiment retrieval in genomic databases

    Genomik veri tabanlarında deney geri getirimi

    DUYGU DEDE ŞENER

    Doktora

    İngilizce

    İngilizce

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBaşkent Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. HASAN OĞUL

  2. Application of computational biology approaches for the investigation of the molecular mechanisms of cancer across taxonomic groups

    Farklı taksonomik gruplarda kanserin moleküler mekanizmalarının hesaplamalı biyoloji uygulamalarıyla araştırılması

    IŞIL TAKAN

    Doktora

    İngilizce

    İngilizce

    2022

    BiyolojiDokuz Eylül Üniversitesi

    Moleküler Biyoloji-Genetik ve Biyoteknoloji Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ATHANASİA PAVLOPOULOU

  3. Yeni bir ilaç hedefi olarak protein devir hızının (ribozom - proteazom yolakları) genomik veri tabanlarında sorgulanması ve ın-silico validasyonu ile kliniğe translasyonu

    Investigation of protein turnover (ribosome-proteasome pathway) as a new drug target in genomic database and clinical translation with in-silico validation

    ASIM LEBLEBİCİ

    Doktora

    Türkçe

    Türkçe

    2024

    BiyoistatistikDokuz Eylül Üniversitesi

    Onkoloji Ana Bilim Dalı

    PROF. DR. YASEMİN BAŞBINAR

  4. Genomik veritabanlarında indeksleme ve arama yöntemleri üzerine

    On indexing and searching methods for genomic databases

    DENİZ TANIR

    Doktora

    Türkçe

    Türkçe

    2017

    MatematikEge Üniversitesi

    Matematik Ana Bilim Dalı

    PROF. DR. URFAT NURIYEV

  5. Popülasyon genetiği veri formatlarının web tabanlı uygulamalarda birbirine dönüştürülmesi

    Developing a web-based conversioin tool for common population genetics data formats

    MAHMUT AYDIN

    Yüksek Lisans

    Türkçe

    Türkçe

    2018

    BiyomühendislikKafkas Üniversitesi

    Biyomühendislik Ana Bilim Dalı

    YRD. DOÇ. DR. IGOR KRYVORUCHKO