Sınıflama ağaçlarının genetik ilişki çalışmalarındaki performansını etkileyen faktörler
Başlık çevirisi mevcut değil.
- Tez No: 471623
- Danışmanlar: PROF. DR. BAHAR TAŞDELEN
- Tez Türü: Yüksek Lisans
- Konular: Biyoistatistik, Biostatistics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2017
- Dil: Türkçe
- Üniversite: Mersin Üniversitesi
- Enstitü: Sağlık Bilimleri Enstitüsü
- Ana Bilim Dalı: Biyoistatistik ve Tıbbi Bilişim Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 109
Özet
Bu çalışmada, belirli bir hastalıkla ilişkili genleri belirlerken genler arası ilişkilerin sınıflama üzerinde etkili olabileceği hipotezinden yola çıkarak, farklı sınıflama yöntemlerinin performansını etkileyebileceği düşünülen faktörlerin belirlenmesi amaçlanmaktadır. Bu amaçla, ilk olarak simülasyonla farklı büyüklük ve yapılarda veri setleri üretilmiştir. Simülasyonda toplam örneklem büyüklüğü, SNP sayısı, minör allel frekansı ve kalıtım modeli (eklemeli, dominant ve resesif) dikkate alınarak, farklı örneklem büyüklükleri, farklı SNP sayıları ve farklı allel frekansları için veri seti oluşturulmuştur. Simülasyon, • Hasta ve kontrol grubu olmak üzere iki grup, • Her grupta örnek genişliği n=50, 100, 200, 500, • SNP sayısı k=10, 30, 50, 100, 250, 500, 1000, • Minör allel frekansı p=0.001, 0.01, 0.05, • Kalıtım modeli : AA, AB, BB olacak şekilde veri setlerini içermektedir. Daha sonra her veri seti CART, Lojistik Regresyon, C4.5 (J48), C5.0, Yapay Sinir Ağları, Genetik Algoritmalar, Destek Vektör Makineleri teknikleri ile analiz edilmiştir. Ayrıca yöntem, Tıbbi Biyoloji Anabilim Dalı veri arşivinde …… yılları arasında kaydedilmiş olan Alkol tüketimi, veri tabanı üzerinde test edilerek, alkoliklik hastalığı ile ilişkisi değerlendirilen farklı SNP'lere ait genotip kombinasyonları belirlenmiştir.
Özet (Çeviri)
In this study, using classification trees for determination of genotype combination related with diseases and the determination of factors which can effect performance of classification was purposed based on the hypothesis in which association between genes that can be effective on classification. To aplicate classification and regression trees (CART), Logistic Regression, C4.5 (J48), C5.0, Artificial Neural Networks, Genetic Algorithms, Support Vector Machines techniques techniques, first of all data sets with different size and different structure were built. In this simulation research, total sample size, number of single nucleotid polymorphism (SNP), minor allele frequency and model of heredity were taken into account. Simulation data sets included; • Patient and control groups, • Sample size of each groups: n=50, 100, 200 • Number of SNP: k=10, 30, 50 • Minor allele frequency: p=0.001, 0.01, 0.05, • Model of heredity: Additive (AA, AB, BB) After words, all data sets were analyzed by CART, Logistic Regression, C4.5 (J48), C5.0, Artificial Neural Networks, Genetic Algorithms, Support Vector Machines techniques. In CART, Logistic Regression, C4.5 (J48), C5.0, Artificial Neural Networks, Genetic Algorithms, Support Vector Machines techniques, full data set is divided into two parts, training and testing sets. The validity of the model is obtained by training sets, is tested in testing set. This proses is called“cross-validation”. R programming language was used for simulations. In this study, this prosses was repeated for all data sets to be able to determine the most compatible sample size to analyze by CART, Logistic Regression, C4.5 (J48), C5.0, Artificial Neural Networks, Genetic Algorithms, Support Vector Machines techniques. Besides, this method was tested on SNP data belongs to Alcoholism disease patients which was recorded on Department of Medical Biology database archive and genotype combinations related with Alcoholism disease were detected. In this case, it was tried to determine which genotypes of which SNPs caused illness, together.
Benzer Tezler
- Protein fold classification and motif retrieval methods by using the primary and secondary structures
Primer ve sekonder yapılar kullanılarak proteinlerin fold düzeyinde sınıflandırılması ve motif çıkarımı
ÖZLEM POLAT
Doktora
İngilizce
2015
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
PROF. DR. ZÜMRAY DOKUR ÖLMEZ
- Küçük hücreli olmayan akciğer kanserlerinde O6-Metilguanin DNA Metiltransferaz geni promoter metilasyon profilinin belirlenmesi
Determination of O6- Methylguanine DNA Methyltransferase promoter methylation pattern in non-small cell lung cancer
MEHMET EKİM
Yüksek Lisans
Türkçe
2010
GenetikPamukkale ÜniversitesiTıbbi Biyoloji Ana Bilim Dalı
PROF. DR. GÜLSEREN BAĞCI
- Öğretmen adaylarının biyoetik değerleri, bilimsel okuryazarlık ve empati beceri düzeylerinin sınıflar bazında incelenmesi
Investigation of class-based to science teacher candidates' bioethical values, scientific literacy levels and empathy skills
DUYGU TURGUT
Yüksek Lisans
Türkçe
2018
Eğitim ve ÖğretimPamukkale ÜniversitesiFen ve Matematik Alanlar Eğitimi Ana Bilim Dalı
DOÇ. DR. ZEHA YAKAR
- Bazı üzüm çeşit ve anaçlarının ampelografik ve moleküler karakterizasyonu
Ampelographic and molecular characterization of some grape cultivars and rootstocks
ALİ SABIR
Doktora
Türkçe
2008
BiyoteknolojiÇukurova ÜniversitesiZiraat Bölümü
PROF. DR. SAADET BÜYÜKALACA
PROF. DR. SEMİH TANGOLAR
- Sustainable stochastic traffic assignment with multiple objectives and user classes
Birden fazla amaç ve kullanıcı sınıfı ile sürdürülebilir rastlantısal trafik ataması
ÇAĞLA DOĞRU
Yüksek Lisans
İngilizce
2012
Endüstri ve Endüstri MühendisliğiGalatasaray ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
DOÇ. DR. ORHAN FEYZİOĞLU