Geri Dön

Sınıflama ağaçlarının genetik ilişki çalışmalarındaki performansını etkileyen faktörler

Başlık çevirisi mevcut değil.

  1. Tez No: 471623
  2. Yazar: RAGIP ONUR ÖZTORNACI
  3. Danışmanlar: PROF. DR. BAHAR TAŞDELEN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Biyoistatistik, Biostatistics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2017
  8. Dil: Türkçe
  9. Üniversite: Mersin Üniversitesi
  10. Enstitü: Sağlık Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Biyoistatistik ve Tıbbi Bilişim Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 109

Özet

Bu çalışmada, belirli bir hastalıkla ilişkili genleri belirlerken genler arası ilişkilerin sınıflama üzerinde etkili olabileceği hipotezinden yola çıkarak, farklı sınıflama yöntemlerinin performansını etkileyebileceği düşünülen faktörlerin belirlenmesi amaçlanmaktadır. Bu amaçla, ilk olarak simülasyonla farklı büyüklük ve yapılarda veri setleri üretilmiştir. Simülasyonda toplam örneklem büyüklüğü, SNP sayısı, minör allel frekansı ve kalıtım modeli (eklemeli, dominant ve resesif) dikkate alınarak, farklı örneklem büyüklükleri, farklı SNP sayıları ve farklı allel frekansları için veri seti oluşturulmuştur. Simülasyon, • Hasta ve kontrol grubu olmak üzere iki grup, • Her grupta örnek genişliği n=50, 100, 200, 500, • SNP sayısı k=10, 30, 50, 100, 250, 500, 1000, • Minör allel frekansı p=0.001, 0.01, 0.05, • Kalıtım modeli : AA, AB, BB olacak şekilde veri setlerini içermektedir. Daha sonra her veri seti CART, Lojistik Regresyon, C4.5 (J48), C5.0, Yapay Sinir Ağları, Genetik Algoritmalar, Destek Vektör Makineleri teknikleri ile analiz edilmiştir. Ayrıca yöntem, Tıbbi Biyoloji Anabilim Dalı veri arşivinde …… yılları arasında kaydedilmiş olan Alkol tüketimi, veri tabanı üzerinde test edilerek, alkoliklik hastalığı ile ilişkisi değerlendirilen farklı SNP'lere ait genotip kombinasyonları belirlenmiştir.

Özet (Çeviri)

In this study, using classification trees for determination of genotype combination related with diseases and the determination of factors which can effect performance of classification was purposed based on the hypothesis in which association between genes that can be effective on classification. To aplicate classification and regression trees (CART), Logistic Regression, C4.5 (J48), C5.0, Artificial Neural Networks, Genetic Algorithms, Support Vector Machines techniques techniques, first of all data sets with different size and different structure were built. In this simulation research, total sample size, number of single nucleotid polymorphism (SNP), minor allele frequency and model of heredity were taken into account. Simulation data sets included; • Patient and control groups, • Sample size of each groups: n=50, 100, 200 • Number of SNP: k=10, 30, 50 • Minor allele frequency: p=0.001, 0.01, 0.05, • Model of heredity: Additive (AA, AB, BB) After words, all data sets were analyzed by CART, Logistic Regression, C4.5 (J48), C5.0, Artificial Neural Networks, Genetic Algorithms, Support Vector Machines techniques. In CART, Logistic Regression, C4.5 (J48), C5.0, Artificial Neural Networks, Genetic Algorithms, Support Vector Machines techniques, full data set is divided into two parts, training and testing sets. The validity of the model is obtained by training sets, is tested in testing set. This proses is called“cross-validation”. R programming language was used for simulations. In this study, this prosses was repeated for all data sets to be able to determine the most compatible sample size to analyze by CART, Logistic Regression, C4.5 (J48), C5.0, Artificial Neural Networks, Genetic Algorithms, Support Vector Machines techniques. Besides, this method was tested on SNP data belongs to Alcoholism disease patients which was recorded on Department of Medical Biology database archive and genotype combinations related with Alcoholism disease were detected. In this case, it was tried to determine which genotypes of which SNPs caused illness, together.

Benzer Tezler

  1. Protein fold classification and motif retrieval methods by using the primary and secondary structures

    Primer ve sekonder yapılar kullanılarak proteinlerin fold düzeyinde sınıflandırılması ve motif çıkarımı

    ÖZLEM POLAT

    Doktora

    İngilizce

    İngilizce

    2015

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    PROF. DR. ZÜMRAY DOKUR ÖLMEZ

  2. Küçük hücreli olmayan akciğer kanserlerinde O6-Metilguanin DNA Metiltransferaz geni promoter metilasyon profilinin belirlenmesi

    Determination of O6- Methylguanine DNA Methyltransferase promoter methylation pattern in non-small cell lung cancer

    MEHMET EKİM

    Yüksek Lisans

    Türkçe

    Türkçe

    2010

    GenetikPamukkale Üniversitesi

    Tıbbi Biyoloji Ana Bilim Dalı

    PROF. DR. GÜLSEREN BAĞCI

  3. Öğretmen adaylarının biyoetik değerleri, bilimsel okuryazarlık ve empati beceri düzeylerinin sınıflar bazında incelenmesi

    Investigation of class-based to science teacher candidates' bioethical values, scientific literacy levels and empathy skills

    DUYGU TURGUT

    Yüksek Lisans

    Türkçe

    Türkçe

    2018

    Eğitim ve ÖğretimPamukkale Üniversitesi

    Fen ve Matematik Alanlar Eğitimi Ana Bilim Dalı

    DOÇ. DR. ZEHA YAKAR

  4. Bazı üzüm çeşit ve anaçlarının ampelografik ve moleküler karakterizasyonu

    Ampelographic and molecular characterization of some grape cultivars and rootstocks

    ALİ SABIR

    Doktora

    Türkçe

    Türkçe

    2008

    BiyoteknolojiÇukurova Üniversitesi

    Ziraat Bölümü

    PROF. DR. SAADET BÜYÜKALACA

    PROF. DR. SEMİH TANGOLAR

  5. Sustainable stochastic traffic assignment with multiple objectives and user classes

    Birden fazla amaç ve kullanıcı sınıfı ile sürdürülebilir rastlantısal trafik ataması

    ÇAĞLA DOĞRU

    Yüksek Lisans

    İngilizce

    İngilizce

    2012

    Endüstri ve Endüstri MühendisliğiGalatasaray Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ORHAN FEYZİOĞLU