Kümeleme algoritmaları ve paralelleştirilmeleri
Clustering algorithms and their parallelization
- Tez No: 371440
- Danışmanlar: DOÇ. DR. BURAK ORDİN
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Matematik, Computer Engineering and Computer Science and Control, Mathematics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2014
- Dil: Türkçe
- Üniversite: Ege Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Matematik Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 97
Özet
Kümeleme (veya Küme Analizi), verilerin belirli bir benzerlik ölçütüne göre kümelere ayrılmasını amaçlayan bir veri analizi tekniğidir. Diğer bir deyişle, birbirine benzer verilerin bir arada yer aldığı homojen grupları belirleme işidir. Kümelemede ele alınan veri setleri genellikle çok büyüktür. Bu yüzden, geliştirilen yöntemlerin hızı, kümelemedeki başarısı kadar –kimi zaman daha fazla– öneme sahiptir. Her iki yönden de başarılı yöntemler var olsa da, işin doğası nedeniyle potansiyel işlem yükü hala ağırdır. Temel kümeleme algoritmaları seri bir makine modeliyle geliştirilmiştir ve modern bir bilgisayardan kapasitesinin altında verim sağlayabilirler. Bu handikapı aşmanın yolu, yöntemleri paralel hesaplamaya uygun hale getirmektir. Bu tezde, kümeleme yöntemleri ve paralel hesaplama araçları çeşitli açılardan incelenmiş, kümeleme başarısı yüksek iki algoritmanın paralel versiyonları önerilmiştir. Bu algoritmalar, C programlama dili ve OpenMP uygulama programlama arayüzü kullanılarak programlanmış ve alt programları barındıran bir kütüphane oluşturulmuştur. Önerilen yöntemler, teorik ve deneysel olarak analiz edilerek paralelleştirmenin etkisi gösterilmiştir.
Özet (Çeviri)
Clustering (or Cluster Analysis) is a data analysis technique that intends to cluster data according to some similarity measure. In other words, it is a task of identifying homogeneous groups consisting of analogous data. The data sets handled in clustering are usually very large. Thus, the speed of the developed methods is as important as –sometimes more important than– their clustering efficiency. Even though there are methods which are successful in both aspects, the potential work load remains heavy by the nature of the task. Fundamental clustering algorithms are developed using a serial machine model and can achieve a limited efficiency on a modern computer. The way to overcome this handicap is to tailor these methods for parallel computing. In this thesis, clustering methods and parallel computing tools are studied from various aspects, and parallel versions of two clustering algorithms with high clustering efficiency are proposed. These algorithms are then programmed using C programming language and OpenMP application programming interface, and a library containing the subprograms is organized. The effect of the parallelization is presented by theoretically and experimentally analyzing the proposed methods.
Benzer Tezler
- Veri madenciliğinde kümeleme algoritmaları ve kümeleme analizi
Clustering algorithms in data mining and clustering analysis
YASEMİN KOLDERE AKIN
- Merkez tabanlı kümeleme algoritmalarının karşılaştırılması
The comparison a center-based clustering algorithms
AYSEL BİLGİN
Yüksek Lisans
Türkçe
2008
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKocaeli ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. NEVCİHAN DURU
- Karma veriler üzerinde etkin kümeleme algoritmalarının geliştirilmesi
Development of effective clustering algorithms on mixed data
ELVIN NASIBOV
Doktora
Türkçe
2017
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolEge ÜniversitesiMatematik Ana Bilim Dalı
DOÇ. DR. BURAK ORDİN
- Görüntü işleme yöntemlerini kullanarak kimyasal idrar görüntülerinin incelenmesi
Investigation of chemical urine images using image processing methods
AHMET TAŞKIRAN
Yüksek Lisans
Türkçe
2019
Elektrik ve Elektronik MühendisliğiErciyes ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
DOÇ. DR. ENİS GÜNAY
- Otel rezervasyon verilerine göre satış için müşteri profili belirleme
Customer profile determination by hotel reservation data
SALİH CANTEKİN
Yüksek Lisans
Türkçe
2020
TurizmBahçeşehir ÜniversitesiBilgi Teknolojileri Ana Bilim Dalı
DR. ÖĞR. ÜYESİ BETÜL ERDOĞDU ŞAKAR