Geri Dön

A hybrid feature selection model for genome wide association studies

Bütünsel genom ilişkilendirme çalışmaları için hibrid öznitelik seçme modeli

  1. Tez No: 343106
  2. Yazar: SAİT CAN YÜCEBAŞ
  3. Danışmanlar: PROF. DR. NAZİFE BAYKAL, YRD. DOÇ. DR. YEŞİM AYDIN SON
  4. Tez Türü: Doktora
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Biyoteknoloji, Moleküler Tıp, Computer Engineering and Computer Science and Control, Biotechnology, Molecular Medicine
  6. Anahtar Kelimeler: Bütünsel Genom İlişkilendirme Çalışmaları, Karar Ağacı, Destek Vektör Makinası, Prostat Kanseri, Melanoma, Genome Wide Association Studies, Decision Tree, Support Vector Machine, Prostate Cancer, Melanoma
  7. Yıl: 2013
  8. Dil: İngilizce
  9. Üniversite: Orta Doğu Teknik Üniversitesi
  10. Enstitü: Enformatik Enstitüsü
  11. Ana Bilim Dalı: Sağlık Bilişimi Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 180

Özet

Bütünsel genom ilişkilendirme çalışmaları karmaşık hastalıklar ve SNPler arasındaki ilişkileri keşfetmektedir. Bu çalışmalar yüksek miktarda çok boyutlu veri sunmaktadır. Ayrıca SNPler, hastalıklar ve fenotipler arasındaki ilişkiler genellikle doğrusal değildir. Yüksek miktarlı çok boyutlu verilerle çalışmak ve aralarındaki ve doğrusal olmayan ilişkileri bulabilmek için veri madenciliğine ihtiyaç duyulmaktadır. Genotip ve fenotip bilgilerini birleştirerek bunlar üzerinde çıkarsama yapan, karar ağacı ve destekçi vektör makinasından oluşan bir hibrid sistem tasarlanmıştır. Tasarlanan model NCBIın dbGaP veritabanından indirilmiş olan prostat ve melanoma veri kümeleri üzerinde denenmiştir. Prostat veri kümesinde sadece genotip bilgileri kullanıldığında %71,67lik kesinlik sonucu, sadece fenotip bilgileri kullanıldığında %84,3 kesinlik sonucu; genotip ve fenotip bilgileri birleştirildiğinde ise %93,81?e yükselen kesinlik sonucu elde edilmiştir. Melanoma veri kümesinde sadece genotipler kullanıldığında %57,12, sadece fenotip bilgileri kullanıldığında %75,18 ve fenotip ile genotip bilgileri birleştirildiğinde %86,35lik bir kesinlik sonucu elde edilmiştir. Prostat üzerinde çalıştırılan sistem, %90.92lik duyarlılık ve 0.91lik ROC eğrisi altında kalan alan ile Prostata Özel Antijen Testine üstünlük göstermiştir. Melanoma için ise hibrid modelin seçmiş olduğu fenotip ve genotip özellikleri bundan önceki çalışmalarda incelenmiş olup bu durum kurulan hibrid sistemin melanoma için en ayırt edici özellikleri seçme yetisi olduğunu göstermektedir. Bu sayede melanoma için kurulan hibrid sistemin risk gruplarını ayırt etme potansiyeli bulunmaktadır.

Özet (Çeviri)

Through Genome Wide Association Studies (GWAS) many SNP-complex disease relations have been investigated so far. GWAS presents high amount high dimensional data and relations between SNPs, phenotypes and diseases are most likely to be nonlinear. In order to handle high volume-high dimensional data and to be able to find the nonlinear relations, data mining approaches are needed. A hybrid feature selection model of support vector machine and decision tree has been designed. This model also combines the genotype and phenotype information to increase the diagnostic performance. The model is tested on prostate cancer and melanoma data that have been downloaded from NCBIs dbGaP database. On prostate cancer data the hybrid system performed 71.67% accuracy on data set consists of only genotypes, 84.23% accuracy on data set consists of only phenotypes and when genotyping and phenotypes are integrated accuracy increased to 93.81%. On melanoma data, the hybrid system performed 57.12% accuracy for only genotypes, 75.48% accuracy for only phenotypes and when genotyping and phenotypes are integrated accuracy increased to 86.35%. For prostate cancer case the hybrid systems has performance indicators of 90.92% of sensitivity and 0.91 AUC, which outperforms Prostate Specific Antigen (PSA) test. In melanoma case selected phenotypic and genotypic features were also examined by previous studies that shows the ability of the system to select most predictive features so the hybrid system on melanoma case has a potential to be used for identifying the risk groups.

Benzer Tezler

  1. Ulusal yazılım açıklık veri tabanı oluşturulması kapsamında android açıklıklarının modellenmesi ve analiz edilmesi

    Establishment of national software vulnerability's database

    KEREM GENCER

    Doktora

    Türkçe

    Türkçe

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSelçuk Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. FATİH BAŞÇİFTÇİ

  2. Adli tıp verileri kullanılarak yara tiplerinin derin öğrenme modelleriyle sınıflandırılması

    Classification of wound types with deep learning models using forensic data

    KÜBRA YILDIRIM

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolFırat Üniversitesi

    Adli Bilişim Mühendisliği Ana Bilim Dalı

    DOÇ. DR. TÜRKER TUNCER

  3. A hybrid feature subset selection method based on GRASP and relief

    GRASP ve relief temelli bir hibrit özellik alt kümesi seçimi

    BUSE NUR KARATEPE

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Mühendislik BilimleriSabancı Üniversitesi

    Veri Bilimi Ana Bilim Dalı

    DOÇ. DR. KEMAL KILIÇ

  4. Parçacık sürü optimizasyonu ve elastik net düzenlemesine dayalı hibrit bir değişken seçim yöntemi

    A hybrid feature selection method based on particle swarm optimization and elastic net regularization

    BURAK ARKANÖZ

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    İstatistikMarmara Üniversitesi

    İstatistik Ana Bilim Dalı

    PROF. DR. DENİZ İNAN

  5. A hybrid deep learning metaheuristic model for diagnosis of diabetic retinopathy

    Diyabetik retinopatinin tanısı için hibrit bir derin öğrenme meta-sezgisel modeli

    ÖMER FARUK GÜRCAN

    Doktora

    İngilizce

    İngilizce

    2022

    Endüstri ve Endüstri Mühendisliğiİstanbul Teknik Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ÖMER FARUK BEYCA