Geri Dön

SYMPES yöntemiyle kanser hastalıklarında önemli genlerin saptanması ve kanser türlerinin sınıflandırılması

Detection of significant genes in cancer diseases and classification of cancer types by SYMPES method

  1. Tez No: 641382
  2. Yazar: ALİ SARIKAŞ
  3. Danışmanlar: PROF. DR. BEKİR SIDDIK BİNBOĞA YARMAN, DR. ZELİHA GÖRMEZ
  4. Tez Türü: Doktora
  5. Konular: Biyomühendislik, Elektrik ve Elektronik Mühendisliği, Genetik, Bioengineering, Electrical and Electronics Engineering, Genetics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2020
  8. Dil: Türkçe
  9. Üniversite: İstanbul Üniversitesi-Cerrahpaşa
  10. Enstitü: Lisansüstü Eğitim Enstitüsü
  11. Ana Bilim Dalı: Biyomedikal Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Biyomedikal Mühendisliği Bilim Dalı
  13. Sayfa Sayısı: 150

Özet

Mikrodizi teknolojisi, organizmaların genomik dizi bilgilerini kullanarak, sağlık ve hastalık durumlarının daha iyi anlaşılması, daha iyi teşhisler koyulması, yeni terapötik müdahaleler sunacak işlevsel biyolojik mekanizmalara dönüştürülmesi gibi görevleri yerine getirecek eşsiz niteliklere sahip olması sayesinde bilimsel araştırmaların önemli bir aracı haline gelmiştir. Mikrodiziler, giderek artan genomik bilgiyi etkili bir şekilde ölçeklendiren güvenilir, hızlı ve uygun maliyetli bir yöntem sağlarlar. Kanserlerin gelişiminde bir çok genin rol aldığı bilinmektedir. Mikrodizi teknolojileri ile aynı anda ve tek seferde tüm genomun analizinin gerçekleştirilmesinin mümkün olmasıyla, sağlıklı ve hasta bireylerin gen ifade profilleri çıkarılarak hastalık durumunu etkileyen genlerin belirlenmesinde önemli bir adım atılmıştır. Bu tezde, Affymetrix gen dizileme cihazından elde edilen 54.675 adet proba karşılık gelen aynı sayıda gen dizilimi SYMPES yöntemi ile modellenmiştir. Geliştirilen SYMPES modeli kullanılarak 5 farklı kanser türünün gelişmesinde etkili olduğu varsayılan farksal olarak ifade edilen genlerin (İng. differentially expressed genes) tespiti yapılmıştır. Affymetrix gen çipi kişilerden temin edilen ve kişilere ilişkin gen ihtiva eden sıvı örnekler üzerinde çalışır. Her bir gen, adına hibridizasyon dediğimiz bir prosese tabi tutularak parlaklık düzeyine göre cihaz tarafından tanımlanır. Başka bir deyişle, art arda cihaz tarafından dizilen genlerin yaklaşık 55.000 gene ilişkin parlaklık düzeyleri bir çıktı olarak cihaz kullanıcısına sunulur. Buna göre, kullanıcı cihaz tarafından dizilimi sabitlenen genleri teker taker N=1,2,...,54675 'e kadar örneklenmiş olduğunu kabul eder ve her gene ilişkin parlaklık düzeyi kayıt altına alınır. Böylesi bir yaklaşımda, gen dizisindeki genler n ile ifade edilirken, bunlara karşı gelen parlaklık düzeyleri X(n) ile ifade edilir. Böylece X(n)=f(n) gibi ayrık zaman domeninde ifade edilen bir fonksiyon olarak ifade edilmiş olur. Böylece SYMPES modelleme yöntemi doğrudan X(n)=f(n) üzerinde uygulanır. Literatüre kazandırılmış önceki çalışmalar incelendiğinde, SYMPES yönteminin biyomedikal alanındaki biyopotansiyel işaretler (EMG, EKG, EEG), konuşma işaretleri, tıbbi cihazlardan alınan görüntüler gibi tek ve iki boyutlu işaretlerin modellenmesinde kullanıldığı görülmüştür. Bu tezde, SYMPES yöntemi Affymetrix gen dizileme cihazından alınan gen dizilerini modellemede kullanılmadan önce, gen ifade verileri 0 ila 1 arasında kalacak şekilde normalize edilir. Ayrık değerler niteliğinde kaydedilmiş N×1 boyutlu sayısal değerler içeren gen ifade veri kümesi, GF(n) olarak verilsin. Bu durumda, SYMPES yöntemine göre, her biri eşit L_F uzunluğunda çerçevelere bölünen işaretin her bir j. çerçevesi için 〖GF〗_j≅G_j E_IE S_IS ,(j=1,2,…,N_F ) şeklinde ifade edilebilir. Burada, G_j çerçeve kazancını ifade eden reel bir sabit; S_IS^T=[S_IS1 S_IS2…S_(ISL_F ) ] işaretin istatistiksel özelliklerini yansıtan ve en küçük ortalama karesel hata (LMS) anlamında G_j S_IS ifadesi ile çerçevenin neredeyse tüm enerjisini içeren bir imza (veya enerji) vektörü; E_IE ise L_F×L_F boyutunda köşegen matris olup G_j S_IS ifadesinin bir zarf (veya bilgi) vektörüdür. Önceden tanımlı bilgi ve enerji vektörleri sınıflandırma çalışmalarında etkin olarak kullanılmıştır. L_F={5,9,15,25} olarak yapılandırılan çerçeve uzunlukları için SYMPES yönteminin sınıflandırma başarımları irdelenmiş, buna ek olarak k-en yakın komşu (İng. K-nearest neighbors, KNN), destek vektör makineleri (İng. Support vector machines, SVM), rasgele orman (İng. Random forest, RF) ve sade bayes (İng. Naive Bayes, NB) sınıflandırma yöntemleri ile bu yöntemin karşılaştırmaları da yapılmıştır. Bunun yanı sıra, her bir grup için evrensel ortalama ve ortanca bilgi kütüphaneleri de farksal olarak ifade edilen genlerin tespit edilmesinde kullanılmak üzere oluşturulmuştur. SYMPES yönteminin farksal olarak ifade edilen genleri tespit edebilmesindeki başarımını arttırmak üzere, evrensel bilgi kütüphaneleri Wilcoxon sıra sayıları-toplam testi, Welch t-testi, kat değişimi (İng. Fold change), Pearson özilinti katsayısı (İng. Pearson correlation coefficient) ve ailesel ortak hata oranı (İng. Family-wise errror rate, FWER) düzeltme yöntemleri kullanılmak suretiyle 6 farklı yaklaşım önerilmiştir. Bunların içerisinde, SPCCFmin-max yöntemi veri kümelerinin hemen hepsinde tüm ikili gruplar arasında %100'e varan oranda önemli genleri tespit edebilmiştir. SYMPES yöntemi, bu yaklaşımların her biri için yeni önemli gen listesi oluşturur ve GEO2R platformu ile elde edilen referans gen listesini baz alarak ortak genlerin sayısını ortaya çıkarır. Tezde elde edilen sonuçlara göre, SYMPES yönteminin kanser hastalıklarının türlerinin tespitinde ve bu hastalıklara ilişkin etkin genlerin belirlenmesinde yüksek başarı oranı ile kullanılabileceği gösterilmiştir.

Özet (Çeviri)

Microarray technology has become an important tool of scientific research, using the genomic sequence information of organisms, having unique qualities to perform tasks such as better understanding of health and disease conditions, better diagnoses, and transformation into functional biological mechanisms that will provide new therapeutic interventions. Microarrays provide a reliable, fast and cost-effective method that effectively scales increasing genomic information. It is known that many genes play a role in the development of cancers. With the ability to perform the analysis of the entire genome at once with microarray technologies, an important step was taken to identify the genes affect the disease state by revealing the gene expression profiles of healthy and unhealthy ones. In this thesis, the same number of gene sequences corresponding to 54,675 probes obtained from the Affymetrix gene sequencing device were modeled with the SYMPES method. By using the developed SYMPES model, differentially expressed genes, which are assumed to be effective in the development of 5 different types of cancer, were detected. The Affymetrix GeneChip works on liquid samples that are available from individuals and contain gene related to individuals. Each gene is identified by the device according to the brightness level by subjected to a process called hybridization. In other words, the brightness levels of about 55,000 genes of the genes sequenced by the device are presented to the user of the device as an output. Accordingly, the user assumes that the genes whose sequences are fixed by the device are sampled one by one until N = 1,2,...,54675 and the brightness level for each gene is recorded. In such an approach, the genes in the gene sequence are expressed by n, while their corresponding brightness levels are expressed by X(n). Thus, it is expressed as a function in a discrete time domain such as X(n) = f(n). Thus, the SYMPES modeling method is applied directly on X(n) = f(n). When the previous studies in the literature were examined, it was seen that SYMPES method was used in the modeling of one and two-dimensional signals such as biopotential signals (EMG, ECG, EEG), speech signals and images captured from medical devices. In this thesis, before the SYMPES method is used to model gene sequences from the Affymetrix gene sequencing device, gene expression data is normalized to remain between 0 and 1. The gene expression dataset containing N×1 dimensional numerical values recorded as discrete values is given as GF(n). In this case, according to the SYMPES method, each frame of the signal divided into frames of equal L_F length can be expressed as 〖GF〗_j≅G_j E_IE S_IS ,(j=1,2,…,N_F ). Here, G_j is a real constant that expresses the frame gain; S_IS^T=[S_IS1 S_IS2…S_(ISL_F ) ] expression is a signature (or energy) vector that reflects the statistical properties of the signal and contains almost all the energy of the frame with the expression G_j S_IS in the sense of the least mean square error (LMS); E_IE is a diagonal matrix of size L_F×L_F which is an envelope (or information) vector of the G_j S_IS expression. Predefined information and energy vectors have been used effectively in classification studies. Classification performances of SYMPES method for frame lengths configured as L_F={5,9,15,25} are examined, in addition k-nearest neighbor (KNN), support vector machines (SVM), random forest (RF) and Naive Bayes (NB) classification methods were also compared with this method. In addition, universal mean and median information libraries for each group were created to be used to detect genes that are expressed differentially. To increase the performance of the SYMPES method in detecting differentially expressed genes, a total of 6 new methods have been proposed using Wilcoxon rank-sum test, Welch's t-test, fold-change, Pearson correlation coefficient, and family-wise error rate correction. Among these, the SPCCFmin-max approach was able to detect up to 100% important genes among all binary groups in almost all datasets. The SYMPES method creates a new significant gene list for each of these approaches and reveals the number of common genes based on the reference gene list obtained by the GEO2R platform. According to the results obtained in the thesis, it has been shown that SYMPES method can be used to classify the types of cancer diseases and to determine the significant genes related to these diseases with high success rate.

Benzer Tezler

  1. Sympes yöntemiyle biyomedikal görüntülerin modellenmesi

    Medical image modelling via sympes algorithm

    İNCİ ZAİM GÖKBAY

    Doktora

    Türkçe

    Türkçe

    2013

    Biyomühendislikİstanbul Üniversitesi

    Biyomedikal Mühendisliği Ana Bilim Dalı

    PROF. DR. BEKİR SIDDIK YARMAN

  2. Makarnanın pişirilmesinde alternatif yöntem olarak ohmik ısıtmanın kullanılması

    Use of ohmic heating as an alternative method for cooking of pasta

    YELİZCAN TURGUT

    Yüksek Lisans

    Türkçe

    Türkçe

    2018

    Gıda MühendisliğiSüleyman Demirel Üniversitesi

    Gıda Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ERKAN KARACABEY

  3. SYMPES yöntemi ile video görüntülerinin sıkıştırılması

    Compression of video images with SYMPES method

    TÜRKER TOGAY AKSOY

    Doktora

    Türkçe

    Türkçe

    2023

    Biyomühendislikİstanbul Üniversitesi-Cerrahpaşa

    Biyomedikal Mühendisliği Ana Bilim Dalı

    PROF. DR. BEKİR SIDDIK BİNBOĞA YARMAN

  4. 3. Murat minyatürlerinde mimari (1574-95)

    Başlık çevirisi yok

    AJAZ ANVAR

    Doktora

    Türkçe

    Türkçe

    1977

    Mimarlıkİstanbul Teknik Üniversitesi

    PROF. DOĞAN KOBAN

  5. A new model for speech compression

    Ses sıkıştırma için yeni bir yöntem

    ASENA EKŞİOĞLU

    Yüksek Lisans

    İngilizce

    İngilizce

    2021

    Elektrik ve Elektronik MühendisliğiIşık Üniversitesi

    Elektronik Mühendisliği Ana Bilim Dalı

    PROF. DR. ÜMİT GÜZ

    PROF. DR. HAKAN GÜRKAN