Genomik veri tabanlarında metin tabanlı deney geri getirimi
Text-based experiment retrieval in genomic databases
- Tez No: 714914
- Danışmanlar: DR. ÖĞR. ÜYESİ DUYGU DEDE ŞENER
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2021
- Dil: Türkçe
- Üniversite: Başkent Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
- Sayfa Sayısı: 71
Özet
Genomik veriden biyolojiksel bilginin çıkarımı biyoinformatik alanında oldukça önemlidir. Genomik veri deneysel ölçümler, sekans verileri, network olmak üzere farklı veri formatlarında saklanmaktadır. Bu veri yapılarının GEO (Gene Expression Omnibus), ArrayExpress ve GenBank gibi veri tabanlarında hızla artan miktarları ile birlikte doğru ve ilgili veriye ulaşmak önemli bir konu haline gelmiştir. Çalışmada veri tabanlarının deney benzerliklerini bulma yetersizliğinin giderilmesi amacı ile genomik veri tabanlarından ilgili deneylerin geri getirimi için metin tabanlı bir geri getirim alt yapısı geliştirilmesi hedeflenmiştir. Geliştirilen alt yapıda sözcük tabanlı (lexical) ve anlam (semantic) tabanlı benzerlik bulma yöntemleri kullanılıp, yöntem performansları kıyaslanmıştır. Sözcük tabanlı yöntem olarak Jaccard benzerlik metriği kullanılırken, anlam tabanlı benzerlik yöntemleri olarak Latent Semantic Analysis (LSA), Probabilistic Latent Semantic Analysis (PLSA) ve Latent Dirichlet Allocation (LDA) yöntemleri kullanılmıştır. Bildiğimiz kadarıyla, bu çalışma ilk kez anlamsal benzerlik yöntemlerini zaman serisi mikrodizi deneylerinin geri getiriminde kullanan çalışmadır. Sistem performansı, GEO veri tabanından alınan Arabidopsis Thaliana bitkisine ait 120 farklı zaman serisi deneyinin açıklama metinleri ile test edilmiş ve elde edilen deneysel sonuçların biyolojiksel ve istatiksel anlamlılıkları doğrulanmıştır. Sonuçlara göre anlam tabanlı yöntemlerin ilgili deneyleri tespit etmede sözcük ve içerik-tabanlı geri getirim yöntemlerine göre daha başarılı olduğu gözlemlenmiştir. Geliştirilen sistemin mevcut deney geri getirim alt yapılarına göre daha başarılı performans elde etmesi ile gelecek çalışmalara ışık tutması beklenmektedir. Aynı zamanda geliştirilen alt yapı farklı türdeki genomik verilerin benzerliklerini bulmak için kolaylıkla uyarlanabilecek bir sistemdir.
Özet (Çeviri)
Extraction of biological information from genomic data is very important in the field of bioinformatics. Genomic data is stored in different data formats such as experimental measurements, sequence data and network. With the rapid growth of these data structures in databases such as GEO (Gene Expression Omnibus), ArrayExpress and GenBank, reaching accurate and relevant data has become an important issue. In thisstudy, it is aimed to develop a text-based experiment retrieval framework for the retrieval of relevant experiments from genomic databases. In the proposed framework, Jaccard similarity metric was used as a lexical similarity method, Latent Semantic Analysis (LSA), Probabilistic Latent Semantic Analysis (PLSA) and Latent Dirichlet Allocation (LDA) methods were used as semantic similarity methods. To the best of our knowledge, this is the first study to use semantic similarity methods in the retrieval of time-series microarray experiments. The system performance was tested with the textual information of 120 different time series experiments of Arabidopsis Thaliana plant obtained from the GEO database. With the biological and statistical significance tests, obtained results were verified. As a result, it was observed that semantic similarity approaches were more successful than text-based and content-based retrieval methods in identifying relevant experiments. It is expected that the developed system will shed light on future studies by achieving a successful performance in retrieving relevant experiments. Moreover, the framework can be easily adapted to different types of genomic data.
Benzer Tezler
- Experiment retrieval in genomic databases
Genomik veri tabanlarında deney geri getirimi
DUYGU DEDE ŞENER
Doktora
İngilizce
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBaşkent ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. HASAN OĞUL
- Application of computational biology approaches for the investigation of the molecular mechanisms of cancer across taxonomic groups
Farklı taksonomik gruplarda kanserin moleküler mekanizmalarının hesaplamalı biyoloji uygulamalarıyla araştırılması
IŞIL TAKAN
Doktora
İngilizce
2022
BiyolojiDokuz Eylül ÜniversitesiMoleküler Biyoloji-Genetik ve Biyoteknoloji Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ATHANASİA PAVLOPOULOU
- Yeni bir ilaç hedefi olarak protein devir hızının (ribozom - proteazom yolakları) genomik veri tabanlarında sorgulanması ve ın-silico validasyonu ile kliniğe translasyonu
Investigation of protein turnover (ribosome-proteasome pathway) as a new drug target in genomic database and clinical translation with in-silico validation
ASIM LEBLEBİCİ
Doktora
Türkçe
2024
BiyoistatistikDokuz Eylül ÜniversitesiOnkoloji Ana Bilim Dalı
PROF. DR. YASEMİN BAŞBINAR
- Genomik veritabanlarında indeksleme ve arama yöntemleri üzerine
On indexing and searching methods for genomic databases
DENİZ TANIR
- Popülasyon genetiği veri formatlarının web tabanlı uygulamalarda birbirine dönüştürülmesi
Developing a web-based conversioin tool for common population genetics data formats
MAHMUT AYDIN
Yüksek Lisans
Türkçe
2018
BiyomühendislikKafkas ÜniversitesiBiyomühendislik Ana Bilim Dalı
YRD. DOÇ. DR. IGOR KRYVORUCHKO