Geri Dön

Çok boyutlu veriler için kümeleme algoritması geliştirilmesi

Developing clustering algorithm for multidimensional datas

  1. Tez No: 372015
  2. Yazar: SİNEM ÖREN
  3. Danışmanlar: YRD. DOÇ. DR. HASAN BULUT
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2014
  8. Dil: Türkçe
  9. Üniversite: Ege Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 104

Özet

Günümüzde mikrodizi teknolojisi sayesinde genlerin farklı seviyelerini eş zamanlı olarak ifade etmek mümkün hale gelmiştir. Genler içindeki gizli bilgilerin temsil edilmesi, genlerin anlaşılabilirliğini kolaylaştırmakta; ancak gen sayısının fazla olması ve veri setlerindeki yüksek gürültü miktarı gen verilerinin anlaşılmasını zorlaştırmaktadır. Bunun için genlerin anlaşılabilirliğini kolaylaştırmak amacıyla kümeleme kullanılmaktadır. Mikrodizi verileri çok boyutlu verilere en iyi örneklerdendir. Çok boyutlu verileri kümelendirmek için tez kapsamında geleneksel K-means ve PSO kümeleme algoritmaları için başlangıç küme merkezlerinin seçimine yönelik farklı yöntemler geliştirilmiştir. Ayrıca öbek (coreset) yaklaşımı PSO algoritmasına uyarlanmıştır. Geliştirilen yöntemlerin doğruluğu; literatürde sıkça kullanılan Iris, Breast Cancer, CMC, Glass, Heart, Ionosphere, Wine, Yeast, Zoo veri setleri üzerinde test edilmiş ve bu yaklaşımlar Colon Cancer mikrodizi veri seti üzerinde çalıştırılmıştır. Baz alınan geleneksel K-means ve PSO kümeleme yöntemleri ile geliştirilen yaklaşımlar karşılaştırılmış; performansları çözüme ulaşılan ortalama iterasyon sayısı, toplam uygunluk değeri, Rand ve Silhouette indeksleri kullanılarak değerlendirilmiştir. Deneysel çalışmalarda, geliştirilen yaklaşımların özellik seçimi yapılmış normalize veri setleri üzerinde başarılı sonuçlar verdiği gözlemlenmiştir.

Özet (Çeviri)

Nowadays, thanks to microarray technology, simultaneously expressing different levels of genes is possible. Although representation of confidential information in genes simplify the intelligibility of them; high number of genes and high amount of noise in the data sets make the intelligibility of gene data difficult to understand. In order to facilitate intelligibility of genes, clustering is used. Microarray data is one of the best examples of multidimensional data. In this study, in order to cluster multidimensional data, different methods for selecting initial cluster centers are developed for the conventional K-means and PSO clustering algorithms. Also, coreset approach is adapted for PSO algorithm. Correctness of the developed methods are examined on the Iris, Breast Cancer, CMC, Glass, Heart, Ionosphere, Wine, Yeast, Zoo datasets which are frequently used in the literature, and also these proposed approaches are run on Colon Cancer microarray data set. The performance of the proposed approaches are compared with the traditional K-means and PSO methods by means of average iteration number, fitness value, Rand and Silhouette index metrics. In experimental studies, we observe that proposed methods give superior results on the normalized datasets in which feature selection process is performed.

Benzer Tezler

  1. Karma veriler üzerinde etkin kümeleme algoritmalarının geliştirilmesi

    Development of effective clustering algorithms on mixed data

    ELVIN NASIBOV

    Doktora

    Türkçe

    Türkçe

    2017

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolEge Üniversitesi

    Matematik Ana Bilim Dalı

    DOÇ. DR. BURAK ORDİN

  2. Short term electricity load forecasting with deep learning

    Derin öğrenme ile kısa dönemli elektrik yük talep tahmini

    İBRAHİM YAZICI

    Doktora

    İngilizce

    İngilizce

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ÖMER FARUK BEYCA

  3. Zeki öğretim sistemlerinde veri madenciliği kullanılması

    Using data mining on intelligent tutoring systems

    BUKET DOĞAN

    Doktora

    Türkçe

    Türkçe

    2006

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolMarmara Üniversitesi

    Elektronik-Bilgisayar Eğitimi Ana Bilim Dalı

    PROF.DR. YILMAZ ÇAMURCU

  4. Fake news classification using machine learning and deep learning approaches

    Makine öğrenimi ve derin öğrenme yaklaşımlarını kullanarak sahte haber sınıflandırması

    SAJA ABDULHALEEM MAHMOOD AL-OBAIDI

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ TUBA ÇAĞLIKANTAR

  5. Fuzzy clustering based ensemble learning approach: Applications in digital advertising

    Bulanık kümeleme tabanlı topluluk öğrenmesi yaklaşımı: Dijital reklam alanında uygulamalar

    AHMET TEZCAN TEKİN

    Doktora

    İngilizce

    İngilizce

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    İşletme Mühendisliği Ana Bilim Dalı

    PROF. DR. FERHAN ÇEBİ

    PROF. DR. TOLGA KAYA