n < p boyutlu biyolojik verilerde farklı kümeleme yöntemlerinin karşılaştırmalı olarak incelenmesi
A comparative study of different clustering methods on the biological data with n
- Tez No: 85341
- Danışmanlar: PROF. DR. NECATİ YILDIZ
- Tez Türü: Doktora
- Konular: Ziraat, Agriculture
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 1999
- Dil: Türkçe
- Üniversite: Harran Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Zootekni Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 157
Özet
Araştırma, n(küçüktür) p boyutlu olan, 24 farklı Antepfıstığı (Pistacia vera L.) tipi ve bu tiplerden alman 38 adet değişken üzerinde yapılmıştır. Ancak bu tip bir veri matrisine kümeleme analizine ilişkin bazı çok değişkenli test istatistiklerinin uygulanabilmesi için değişken sayısının (n^p) azaltılması gerekmektedir. Değişken sayısının azaltılmasında Ana Bileşenler (Principal Component) analizi, Ayırma (Diskriminant) analizi ve Korelasyon analizinden yararlanılmıştır. Sözü edilen metotlarla indirgenen değişkenler, farklı kümeleme metotlarıyla karşılaştırmalı olarak incelenmiştir. Sonuçta, kümelemede en uygun yöntemin Ana Bileşenler analizi ile birlikte kullanılan Ward metodunun olduğu belirlenmiştir. Küme sayısının belirlenmesinde ise en uygun ölçütün Cmax, Wilks Lambda ve Hotelling Lawley İz istatistiklerinin olduğu belirlenmiştir.ANAHTAR KELİMELER: Kümeleme Analizi, Sayısal Sınıflandırma, Ana Bileşenler Analizi, Ayırma Analizi, Korelasyon Analizi.
Özet (Çeviri)
This research was carried out on 38 variables taken from 24 types of pistachio (Pistacia vera L.) with n(small)p dimensions. However, in order to apply the some multivariate test statistics of clustering analysis to this type data matrix, the number of variables (nâ:p) must be decreased. For decreasing the number of variables, analysis of principle components, analysis of Discriminant and analysis of Principal Components and analysis of Correlation were used. Variables decreased by the methods mentioned above, was comparatively examined by different clustering methods. As a result it was shown that the most suitable method for clustering is the Ward method used with Principle Components analysis. Also it was concluded that the most suitable scales (measurement) to determine the number of clusters are Wilk's Lambda, Cmax and Hotelling Lawley Trace statistics. KEYWORDS: Cluster Analysis, Numerical Taxonomy, Principal Component Analysis, Discriminant Analysis, Correlation Analysis.
Benzer Tezler
- Investigation of cellular pathways in HBV associated liver fibrosis
HBV bağımlı karaciğer fibrozunda hücresel yolakların araştırılması
ŞEYMA KATRİNLİ
Doktora
İngilizce
2016
Biyolojiİstanbul Teknik ÜniversitesiMoleküler Biyoloji-Genetik ve Biyoteknoloji Ana Bilim Dalı
DOÇ. DR. GİZEM DİNLER DOĞANAY
- Mesanenin yüksek grade'li evre pT1 ürotelyal karsinomlarında E-cadherin ekspresyonunun nüks ve progresyonla olan ilişkisi
Başlık çevirisi yok
FİKRET ERDEMİR
- Çok boyutlu kaotik sistemler ile şifreleme
Encryption with multi-dimensional chaotic systems
ASİYE YİĞİT
Yüksek Lisans
Türkçe
1997
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
DOÇ. DR. CÜNEYT GÜZELİŞ
- Penalty and non-penalty estimation strategies for linear and partially linear models
Lineer ve kısmi lineer modeller için cezalı ve cezasız tahmin stratejileri
BAHADIR YÜZBAŞI
Doktora
İngilizce
2014
Ekonometriİnönü ÜniversitesiMatematik Ana Bilim Dalı
PROF. DR. MEHMET GÜNGÖR
PROF. DR. SYED EJAZ AHMED
- Diffraction of acoustic waves by a semi-infinite cylindrical pipe
Akustik dalgaların silindir kesitli yarı-sonsuz bir borudan kırınımı
BURAK POLAT
Doktora
İngilizce
1997
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiElektronik Mühendisliği Ana Bilim Dalı
PROF. DR. ALİNUR BÜYÜKAKSOY