Gen kümeleme işleminin özdüzenleyici haritalar kullanılarak gen ekspresyonu, motif sıklık ve gen konum verilerinden faydalanılarak gerçekleştirimi
Clustering genes by using self-organizing maps together with gene expression, motif frequency and gene location data
- Tez No: 244080
- Danışmanlar: YRD. DOÇ. DR. SONGÜL ALBAYRAK
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2009
- Dil: Türkçe
- Üniversite: Yıldız Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 103
Özet
Gen analizi biyoinformatiğin en önemli çalışma alanlarından birisi olup gen kümeleme işlemi, gen analizinin en kritik adımlarından birisidir. Gen kümeleme işlemi için literatürde en sık kullanılan veri tipi gen ekspresyonu verisidir. Bununla beraber literatürde çok daha az sayıda da olsa, gen kümelemesi için birbirini tamamlayıcı nitelikteki farklı genomik veri tiplerinin birarada kullanılmasını öneren, bu yol ile tek bir genomik veri tipi kullanılması durumunda elde edilemeyecek yeni ve anlamlı gen kümeleri elde edilebileceğini savunan çalışmalar da mevcuttur. Söz konusu çalışmalardan birisi Kasturi ve diğerleri (2005) tarafından sunulan ve gen ekspresyonu ile motif sıklık verilerinin gen kümelemesi için birarada kullanılmasını öneren çalışmadır.Bu tez çalışması kapsamında Kasturi ve diğerleri (2005) tarafından sunulan ve temelleri özdüzenleyici haritalara dayanan gen kümeleme algoritması, üçüncü bir genomik veri tipini de gen kümelemesi işleminde kullanabilecek şekilde genişletilmiştir. Bu amacı gerçekleştirmek için seçilen üçüncü genomik veri tipi gen konum verisidir. Söz konusu algoritma her veri tipi için farklı ve en uygun uzaklık fonksiyonunun kullanımına izin vermektedir. Bu çalışma kapsamında üçüncü veri tipi olarak ele alınan ve algoritmaya eklenen gen konum verisi ile birlikte kullanılmak üzere GLDist adı verilen yeni bir uzaklık fonksiyonu geliştirilmiş ve kullanılmıştır.Geliştirilen yöntemin başarımını sınamak için 100 adet Arabidopsis geninden oluşan bir test veri seti oluşturulmuştur. Yöntem ile elde edilen yeni gen kümelerinin biyolojik anlamlılığını değerlendirebilmek için Gen Ontolojisi ve TAIR veritabanlarından faydalanılarak söz konusu genlere ait moleküler fonksiyon ve biyolojik proses bilgileri elde edilmiş ve bu bilgiler ışığında aynı kümede yer alan genler arasındaki biyolojik benzerlikler incelenmiştir. Elde edilen sonuçların biyolojik değerlendirmesi, geliştirilen yöntemin kullanılması ile yeni ve biyolojik olarak anlamlı gen kümelerinin elde edilebileceğini göstermiştir.
Özet (Çeviri)
Gene analysis is one of the most important tasks in bioinformatics and gene clustering is a crucial step that takes part in it. Gene expression data is the most commonly-used data type for gene clustering. However, there are some researches in literature in which it is proposed to use different types of genomic data for gene clustering in order to detect new and meaningful gene clusters that may not have been obtained by using only a single type of genomic data. The method proposed by Kasturi et al. (2005) is one of such researches in which gene expression and motif frequency data are used together to cluster genes.In this work, the method proposed by Kasturi et al. (2005) is extended by using gene location data as a third type of genomic data together with gene expression and motif frequency data. The method proposed by Kasturi et al. (2005) is based on self-organizing maps. Since the algorithm let us use the most appropriate distance functions for each type of genomic data, a new distance function named GLDist is also created to use with gene location data.In total 100 Arabidopsis genes are chosen as an input dataset to evaluate the results of the proposed method. In order to evaluate the biological significance of the newly obtained clusters by using the proposed method with combined genomic data, Gene Ontology and TAIR databases are used to extract the molecular function and biological process information of each gene. The biological evaluation of the resulting clusters shows that, the proposed method can be used to obtain new and biologically relevant clusters.
Benzer Tezler
- Büyük boyutlu verilerde öznitelik seçimi için ikili yapay arı kolonisi yaklaşımı
Binary artificial bee colony approach for feature selection in large size data
ZEYNEP BANU ÖZGER
Doktora
Türkçe
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolYıldız Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. BANU DİRİ
DR. ÖĞR. ÜYESİ BÜLENT BOLAT
- Yerli tavuk genotiplerinin ticari genotipler ile olan genetik farklılığının SSR (Simple Sequence repeats-Basit dizi tekrarları) yöntemi ile analizi
Analysis of genetic dissimilarity between native and commercial chicken genotypes by SSR (Simple sequence repeats) method
LEVENT MERCAN
Doktora
Türkçe
2010
BiyoteknolojiOndokuz Mayıs ÜniversitesiZootekni Ana Bilim Dalı
PROF. DR. AHMET OKUMUŞ
- RNA-dizileme verilerinin kümelenmesinde yeni istatistiksel yaklaşımlar
Novel statistical approaches in clustering RNA-sequencing data
AHU DURMUŞÇELEBİ
Yüksek Lisans
Türkçe
2019
BiyoistatistikErciyes ÜniversitesiBiyoistatistik Ana Bilim Dalı
DOÇ. DR. GÖKMEN ZARARSIZ
- İkili kümeleme algoritmalarının görsel ve sayısal açıdan karşılaştırılması
Visual and numerical comparison of biclustering algorithms
AHMET KOCATÜRK
Yüksek Lisans
Türkçe
2018
İstatistikGazi Üniversitesiİstatistik Ana Bilim Dalı
DOÇ. DR. BÜLENT ALTUNKAYNAK
- Mikrodizi verileri üzerinde kümeleme algoritmalarının uygulaması
Application of clustering algorithms on microarray data
ASİYE ULAŞ
Yüksek Lisans
Türkçe
2016
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolErciyes ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. DERVİŞ KARABOĞA