Biomarker identification for discrimination of cancer types
Kanser türlerini ayırt edebilmek için biyoişaretçi tanımlaması
- Tez No: 607039
- Danışmanlar: DR. ÖĞR. ÜYESİ ZERRİN IŞIK
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Biyoistatistik, Computer Engineering and Computer Science and Control, Biostatistics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2019
- Dil: İngilizce
- Üniversite: Dokuz Eylül Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 55
Özet
RNA sıralama verileri, doku veya kan örneklerine dayanarak mRNA gen seviyelerinin ölçümlerini sağlar. Transkriptomdaki kritik değişiklikler, RNA dizileme verisi ile daha iyi incelenerek hastalığın davranışını daha doğru şekilde gözlemlemeye yardımcı olur. Bu çalışmada, kan örneklerinden elde edilen RNA dizileme verileri kullanılarak kanser türlerinin doğru şekilde ayırt edilebilmesi için farklı özellik seçim yöntemleri ve makine öğrenme algoritmaları incelenmiştir. Analizde altı kanser türü birbiriyle ve sağlıklı örneklerle karşılaştırılmıştır. Özellik seçim yöntemleri olarak korelasyon katsayısı ve bilgi kazanımı analizleri uygulanmıştır. Seçilen genler, 10 katlı çapraz doğrulama uygulanarak değerlendirilen Destek Vektör Makinesi (SVM), Naif Bayes (NB) ve Rastgele Orman (RF) makine öğrenme algoritmalarına girdi olarak verilmiştir. Deney sonuçlarında, makine öğrenme algoritmaları, hepatobiliyer, akciğer ve pankreas kanseri tiplerinin ayırt edilmesinde 0,85 doğruluk elde etmiştir. Makine öğrenim modelleri doğruluk açısından değerlendirildiğinde, RF ve SVM'nin birçok durumda NB'den daha başarılı olduğu görülmüştür. Literatüre dayalı bir doğrulama, sınıflandırıcılarda kullanılan bazı genlerin, hepatobiliyer ve pankreas kanserlerinin ayırt edilmesinde ümit verici biyobelirteçler olabileceğini ortaya koymuştur.
Özet (Çeviri)
RNA-sequencing data provides measurements of mRNA (messenger RNA) levels of genes based on tissue or blood samples. The critical changes in transcriptome can be observed more accurately by using RNA-sequencing data that eventually helps to understand different behavior of the disease. In this study, different feature selection methods and machine learning algorithms were examined for accurate discrimination of cancer types by using RNA-sequencing data which was obtained from blood samples. In the analysis, six cancer types were compared with each other and healthy samples. Correlation coefficient and information gain analyses are applied as main feature selection methods. The selected genes are provided as the input of Support Vector Machine (SVM), Naïve Bayes (NB), and Random Forest (RF) machine learning algorithms, that were evaluated by applying 10-fold cross-validation. In the experimental results, machine learning algorithms achieved higher than 0.85 accuracies in the discrimination of hepatobiliary, lung, and pancreatic cancer types. When machine learning models are evaluated in terms of accuracy, RF and SVM were more successful than NB for many cases. A literature-based validation revealed that some of the genes used in classifiers might be promising biomarkers for discrimination of hepatobiliary and pancreatic cancers.
Benzer Tezler
- Obez bireylerde eritrosit membranı ve plazma yağ asidi kompozisyonlarının değerlendirilmesi
Evaluation of erythrocyte membrane and plasma fatty acid compositions in obese individuals
BEHİÇ SELMAN ERDOĞDU
Doktora
Türkçe
2024
BiyokimyaNecmettin Erbakan ÜniversitesiKimya Ana Bilim Dalı
PROF. DR. MUSTAFA YÖNTEM
PROF. DR. ABDULLAH SİVRİKAYA
- Makine öğrenmesi yöntemleriyle kanser ile ilgili yeni biyobelirteçlerin tespit edilmesi
Identification of novel systems biomarkers for cancer diagnosis using machine learning techniques
FIRAT KURT
Yüksek Lisans
İngilizce
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolMarmara ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. MUSTAFA AĞAOĞLU
PROF. DR. KAZIM YALÇIN ARĞA
- Pankreas kanseri ilişkili serum bileşenlerinin tespiti ve analizinde Yüzey Geliştirilmiş Raman Spektroskopisi (SERS) substratı olarak polistiren-polianilin filmlerinin kullanılması
Using polystyrene-polyaniline films as substrate for Surface Enhanced Raman Spectroscopy (SERS) for detection and analysis of pancreatic cancer-associated serum components
SEYFURE ADIGÜZEL
Yüksek Lisans
Türkçe
2024
BiyokimyaSağlık Bilimleri ÜniversitesiMoleküler Biyokimya ve Genetik Ana Bilim Dalı
DOÇ. DR. SEVDE ALTUNTAŞ
- Preeklamptik gebelerin maternal plazmalarında dolaşan mikroRNA'ların kantitatif analizi
Quantitative analysis of circulating microRNAs in maternal plasma of preeclamptic pregnants
DİDEM ALTINDİREK
Yüksek Lisans
Türkçe
2016
Genetikİstanbul ÜniversitesiMoleküler Biyoloji ve Genetik Ana Bilim Dalı
DOÇ. DR. TUBA GÜNEL
- MiRNA expression profiling of ovine mammary epithelial cells using RNA-seq technology with staphylococcus aureus-induced mastitis
Staphylococcus aureus kaynakli mastitisin mirna ekspresyon profilinin koyun meme epitel hücrelerinde RNA-seq teknolojisi kullanilarak araştirilmasi
GHULAM ASGHAR SAJID