Gen ifade verileri ile işlemsel kanser sınıflandırılması
Operational cancer classification using gene expression data
- Tez No: 237762
- Danışmanlar: DOÇ. DR. NİZAMİ GASILOV
- Tez Türü: Yüksek Lisans
- Konular: Biyoistatistik, Biostatistics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2009
- Dil: Türkçe
- Üniversite: Başkent Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Bölümü
- Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Sayfa Sayısı: 107
Özet
Son yıllardaki bilgisayar teknolojilerinde elde edilen gelişmeler, özellikle işlemci gücünün artması, önceleri gerçekleştirilebilen sade, doğrusal modeller yerine fiziksel ve gerçek olayları daha iyi yansıtan; ama daha fazla bellek ve zaman gerektiren doğrusal olmayan modellerin kullanılmasına imkan yaratmıştır.Bu çalışma, A. Statnikov'un, mikrodizi gen ifade verileri kullanarak çok kategorili kanser sınıflandırması ile ilgili çalışması ve bu çalışmadan elde edilmiş sonuçlar üzerine önerilmiş olan optimizasyon çalışmalarını kapsamaktadır [1]. Mikrodizi analizi ile elde edilmiş gen ifade verilerinin üzerinde, destek vektör makinesi ile analiz edilmeden önce, doğrusal ve doğrusal olmayan indirgeme yöntemleri kullanılarak, verilerin eğitilme ve test sürecinin hızlandırılması amaçlanmıştır. Uygulanması amaçlanan indirgeme yöntemleri, bir dizi algoritmanın yanı sıra, bu algoritmaların probleme yönelik yeni yorumlamalarıyla yapılmış, daha sonra bu yöntemler karmaşıklık, kaynak kullanımı ve indirgeme performansı göz önünde bulundurularak test edilmiştir. Böylece, eğitim ve test işlemlerinin performans ve başarı oranlarını kabul edilebilir düzeyin üstünde tutmak koşuluyla, veri kümelerindeki nitelik sayısını küçülterek, işlem hızının arttırılması amaçlanmıştır.Yapılan testlerin sonucunda, gen ifade verilerinin bulunduğu veri kümesi üzerinden yapılan Bağımsız Bileşen Analizi (BBA), Çekirdek Temel Bileşen Analizi (ÇTBA), İz Düşümü Takip Analizi (İDTA) indirgeme algoritmaları üzerine oluşturulmuş programların, veri kümesindeki nitelik sayısının aşırı yüksek olmasından dolayı kilitlendiği ya da hafıza yetersizliğinden dolayı olağandışı sonlandırıldığı tespit edilmiştir. Diğer algoritmalar olan Temel Bileşen Analizi (TBA), Doğrusal Olmayan Temel Bileşen Analizi (DOTBA), Kendi Düzenlenen Haritalar (KOH), Doğrusal Diskriminant Analizi (DDA) ve Korelasyon Analizi (KA) ile yapılan nitelik indirgemeleri sonucu, karar destek vektör makinesinin eğitim sürelerinin değişken olarak azaldığı görülmüştür. Buna dayanarak, çalışmada kullanılan veri kümesinin içerdiği niteliklerin büyük bir kısmının, veri kümesinin destek vektör makinesindeki eğitim ve test performansına çok az etkisi olduğu, ayırt edici özellikler taşımadığı veya bazı niteliklerin bir araya gelerek, tüm kümeyi temsil edebilen bir alt grup oluşturabildiğini, bu yüzden etkisiz niteliklerin ya da nitelik alt gruplarının indirgeme algoritmaları kullanılarak orijinal veri kümesinden çıkarılmasının, maliyet ve süre açısından yararlı olacağı anlaşılmıştır.
Özet (Çeviri)
Recent improvements in computer technologies, especially significant increase in processing power of central processing units, leads to usage of non ? linear models which represents physical and abstract problems better but require more memory and time, instead of simple, linear models.This study focuses on A. Statnikov?s article about multicategory cancer classification using of microarray gene expression data and optimization suggestions [1]. Before the training of support vector machines with the gene expression data which is gathered by microarray analysis, it is intented to accelerate the training and test speed process with both linear and non ? linear reduction methods. Reduction methods which are intented to be used are both implemented by using some algorithms and new interpretation of these algorithms. After that, these methods are tested according to their complexity, resource allocation and reduction performance. Therefore, by keeping the performance and success ratios of training and testing process above an acceptable treshold, it is intented to reduce the feature size in data sets as it will also increase the overall speed of the process.The results of the test show that, Independent Component Analysis (ICA), Kernel Principle Component Analysis (KPCA), Projection Pursuit Analysis (PPA) reduction algorithms used on data set failed to give any results due to excessive amount of features in data set by either locking down or terminating itself.With the usage of other algorithms which are Principle Component Analysis (PCA), Non ? Linear Principle Component Analysis (NLPCA), Self Organizing Maps (SOM), Linear Discriminant Analysis (LDA) and Correlation Analysis (CA), it is observed that the training and testing process times of the support vector machine is reduced variably. Taking this into consideration, most of the the features of the data set which is used in this study do not have any differentiative property and therefore have low - level of effect on the training and testing of the support vector machine. On the other hand, some features may become high ? level effective when combined together and form a sub group feature sets. So, by eliminating low ? level effective features and revealing high ? effective sub group features by feature selection and feature reduction, a significant improvement in both cost and time consume can be established.
Benzer Tezler
- SYMPES yöntemiyle kanser hastalıklarında önemli genlerin saptanması ve kanser türlerinin sınıflandırılması
Detection of significant genes in cancer diseases and classification of cancer types by SYMPES method
ALİ SARIKAŞ
Doktora
Türkçe
2020
Biyomühendislikİstanbul Üniversitesi-CerrahpaşaBiyomedikal Mühendisliği Ana Bilim Dalı
PROF. DR. BEKİR SIDDIK BİNBOĞA YARMAN
DR. ZELİHA GÖRMEZ
- Pediatrik öncü B-ALL'de aday prognostik biyobelirteç genlerinin araştırılması
Screening of candidate prognostic biomarker genes in pediatric precursor B-ALL
DİLARA FATMA BALI
- Destek vektör regresyonu ile PID kontrolör tasarımı
Design of PID controller via support vector regression
KEMAL UÇAK
Yüksek Lisans
Türkçe
2012
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiKontrol ve Otomasyon Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. GÜLAY ÖKE
- Analysis of intra-tumoral heterogeneity in context of tissue specific gene expression with computational approach
Tumor içi heterojenitenin dokuya özgün genler ile ilişkisinin hesapsal yaklaşımla incelenmesi
HATİCE BÜŞRA KONUK
Yüksek Lisans
İngilizce
2018
BiyolojiYıldız Teknik ÜniversitesiBiyomühendislik Ana Bilim Dalı
YRD. DOÇ. DR. ALPER YILMAZ
- Investigation of NFİB function and regulation of its putative target genes in human neural stem cell and SH-SY5Y neuroblastoma cell lines
İnsan sinir kök hücre ve SH-SY5Y nöroblastom hücre hatlarında NFIB işlevinin ve potansiyel hedef genlerinin regülasyonunun incelenmesi
BETÜL ULUCA
Doktora
İngilizce
2023
Biyoteknolojiİstanbul Teknik ÜniversitesiMoleküler Biyoloji-Genetik ve Biyoteknoloji Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ASLI KUMBASAR