Çok boyutlu veriler için kümeleme algoritması geliştirilmesi

Developing clustering algorithm for multidimensional datas

PDF İndir

Tez No: 372015
Yazar: SİNEM ÖREN
Danışmanlar: YRD. DOÇ. DR. HASAN BULUT
Tez Türü: Yüksek Lisans
Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
Anahtar Kelimeler: Belirtilmemiş.
Yıl: 2014
Dil: Türkçe
Üniversite: Ege Üniversitesi
Enstitü: Fen Bilimleri Enstitüsü
Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
Bilim Dalı: Belirtilmemiş.
Sayfa Sayısı: 104

Özet

Günümüzde mikrodizi teknolojisi sayesinde genlerin farklı seviyelerini eş zamanlı olarak ifade etmek mümkün hale gelmiştir. Genler içindeki gizli bilgilerin temsil edilmesi, genlerin anlaşılabilirliğini kolaylaştırmakta; ancak gen sayısının fazla olması ve veri setlerindeki yüksek gürültü miktarı gen verilerinin anlaşılmasını zorlaştırmaktadır. Bunun için genlerin anlaşılabilirliğini kolaylaştırmak amacıyla kümeleme kullanılmaktadır. Mikrodizi verileri çok boyutlu verilere en iyi örneklerdendir. Çok boyutlu verileri kümelendirmek için tez kapsamında geleneksel K-means ve PSO kümeleme algoritmaları için başlangıç küme merkezlerinin seçimine yönelik farklı yöntemler geliştirilmiştir. Ayrıca öbek (coreset) yaklaşımı PSO algoritmasına uyarlanmıştır. Geliştirilen yöntemlerin doğruluğu; literatürde sıkça kullanılan Iris, Breast Cancer, CMC, Glass, Heart, Ionosphere, Wine, Yeast, Zoo veri setleri üzerinde test edilmiş ve bu yaklaşımlar Colon Cancer mikrodizi veri seti üzerinde çalıştırılmıştır. Baz alınan geleneksel K-means ve PSO kümeleme yöntemleri ile geliştirilen yaklaşımlar karşılaştırılmış; performansları çözüme ulaşılan ortalama iterasyon sayısı, toplam uygunluk değeri, Rand ve Silhouette indeksleri kullanılarak değerlendirilmiştir. Deneysel çalışmalarda, geliştirilen yaklaşımların özellik seçimi yapılmış normalize veri setleri üzerinde başarılı sonuçlar verdiği gözlemlenmiştir.

Özet (Çeviri)

Nowadays, thanks to microarray technology, simultaneously expressing different levels of genes is possible. Although representation of confidential information in genes simplify the intelligibility of them; high number of genes and high amount of noise in the data sets make the intelligibility of gene data difficult to understand. In order to facilitate intelligibility of genes, clustering is used. Microarray data is one of the best examples of multidimensional data. In this study, in order to cluster multidimensional data, different methods for selecting initial cluster centers are developed for the conventional K-means and PSO clustering algorithms. Also, coreset approach is adapted for PSO algorithm. Correctness of the developed methods are examined on the Iris, Breast Cancer, CMC, Glass, Heart, Ionosphere, Wine, Yeast, Zoo datasets which are frequently used in the literature, and also these proposed approaches are run on Colon Cancer microarray data set. The performance of the proposed approaches are compared with the traditional K-means and PSO methods by means of average iteration number, fitness value, Rand and Silhouette index metrics. In experimental studies, we observe that proposed methods give superior results on the normalized datasets in which feature selection process is performed.

Benzer Tezler

Tez No
479796
Karma veriler üzerinde etkin kümeleme algoritmalarının geliştirilmesi
Development of effective clustering algorithms on mixed data
ELVIN NASIBOV
Doktora
Türkçe
2017
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol Ege Üniversitesi
Matematik Ana Bilim Dalı
DOÇ. DR. BURAK ORDİN
Tez No
728716
Short term electricity load forecasting with deep learning
Derin öğrenme ile kısa dönemli elektrik yük talep tahmini
İBRAHİM YAZICI
Doktora
İngilizce
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol İstanbul Teknik Üniversitesi
Endüstri Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ÖMER FARUK BEYCA
Tez No
944874
Multi-agent planning with automated curriculum learning
Otomatik müfredat öğrenmesi ile çoklu ajan planlaması
ONUR AKGÜN
Doktora
İngilizce
2025
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol İstanbul Teknik Üniversitesi
Mekatronik Mühendisliği Ana Bilim Dalı
DOÇ. DR. NAZIM KEMAL ÜRE
Tez No
185227
Zeki öğretim sistemlerinde veri madenciliği kullanılması
Using data mining on intelligent tutoring systems
BUKET DOĞAN
Doktora
Türkçe
2006
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol Marmara Üniversitesi
Elektronik-Bilgisayar Eğitimi Ana Bilim Dalı
PROF.DR. YILMAZ ÇAMURCU
Tez No
847173
Fake news classification using machine learning and deep learning approaches
Makine öğrenimi ve derin öğrenme yaklaşımlarını kullanarak sahte haber sınıflandırması
SAJA ABDULHALEEM MAHMOOD AL-OBAIDI
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol Gazi Üniversitesi
Bilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ TUBA ÇAĞLIKANTAR

Geri Dön