Geri Dön

Kümeleme algoritmalarının CPU ve GPU performanslarının analizi

Analysis of CPU and GPU performances of clustering algorithms

  1. Tez No: 773497
  2. Yazar: MELEK GÜLER MANAV
  3. Danışmanlar: DOÇ. DR. METİN BİLGİN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2022
  8. Dil: Türkçe
  9. Üniversite: Bursa Uludağ Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 53

Özet

Teknolojinin ilerlemesi, teknolojideki rekabeti her geçen gün artırmaktadır. Teknolojide ilerleme artarken müşterileri ve kullanıcıları memnun etmek güçleşmektedir. Çeşitli teknolojik aygıtlar sebebiyle üretilen veri miktarı artmakta bu da firmaların eldeki verileri analiz etmeleri için farklı metotlara yönelmelerine sebebiyet vermektedir. Günümüz dünyasında verilerin analiz edilmesi ve yorumlanması çok önemli olduğundan bu işlemi elle yapmak yerine makinelere yaptırma gereği ve ihtiyacı doğmuştur. Eldeki verilerin etiketlerinin bilinmediği durumlarda bunları analiz edebilmek adına kümeleme algoritmalarından yararlanılmaktadır. Kümeleme algoritmaları verileri gruplara ayırmaktadır ve bu sayede verilerin analiz edilmesi, yorumlanması kolay hale getirilmektedir. Bu tez çalışmasında, mevcutta kullanılan beş farklı kümeleme algoritmasının CPU ve GPU üzerindeki performansları araştırılmış ve bunları tespit etmeye yönelik deneysel çalışmalar gerçekleştirilmiştir. Kümeleme algoritmalarının performanslarını ölçebilmek adına yapılan deneysel çalışmalarda e-postalardan oluşan Enron veri kümesi kullanılmıştır. Çalışmada kümeleme algoritmaları olarak; model bazlı Cobweb, yoğunluk bazlı Dbscan, grid bazlı Clique, bölümlemeli K-Means, hiyerarşik olarak ise Birch algoritmaları seçilmiştir. Deneysel çalışmalar için gerekli ortam Python dilinde Google Colab üzerinde gerçekleştirilmiştir. Deneysel çalışma sonuçları grafikler ve tablolar ile ifade edilerek analiz sonuçları sunulmuştur.

Özet (Çeviri)

The advancement of technology increases the competition in technology area day by day. As technology advances, it becomes more difficult to satisfy customers and users. The amount of data produced with the help of various technological devices is increasing, which causes companies to turn to different methods to analyze the data at hand. Since the analysis and interpretation of data is very important in today's world, the need and need to have this process done by machines has arisen instead of doing it manually. In cases where the labels of the available data are not known, clustering algorithms can be used to analyze them. With the help of clustering algorithms, the data can be grouped and made easier to analyze and interpret on this occasion. In this thesis, the performances of five different clustering algorithms currently used on CPU and GPU were investigated and experimental studies were carried out to detect them. In order to measure the performance of clustering algorithms, a dataset consisting of e-mails that name is Enron was used in experimental studies. As clustering algorithms in the study; model based Cobweb, density based Dbscan, grid based Clique, segmented K-Means, hierarchical Birch were selected. The necessary environment for the experimental studies was carried out on Google Colab in Python language. Experimental study results are expressed with graphs and tables, and analysis results are presented.

Benzer Tezler

  1. Merkez tabanlı kümeleme algoritmalarının karşılaştırılması

    The comparison a center-based clustering algorithms

    AYSEL BİLGİN

    Yüksek Lisans

    Türkçe

    Türkçe

    2008

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKocaeli Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. NEVCİHAN DURU

  2. Çok boyutlu uzayda görsel veri madenciliği için üç yeni çatı tasarımı ve uygulamaları

    Three new frameworks for the design and application of visual data mining in high dimensional space

    TURGAY TUGAY BİLGİN

    Doktora

    Türkçe

    Türkçe

    2007

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolMarmara Üniversitesi

    Elektronik-Bilgisayar Eğitimi Ana Bilim Dalı

    PROF.DR. ALİ YILMAZ ÇAMURCU

  3. EKG verileri için gerçek zamanlı veri analitiği mimarisi

    Real time data analytics architecture for ECG

    NUR BANU OĞUR

    Yüksek Lisans

    Türkçe

    Türkçe

    2018

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSakarya Üniversitesi

    Bilgisayar ve Bilişim Mühendisliği Ana Bilim Dalı

    PROF. DR. CELAL ÇEKEN

  4. Approximate processor design with Risc-V isa

    Rısc-V komut kümesi mimarisiyle yaklaşık işlemci tasarımı

    İBRAHİM TAŞTAN

    Yüksek Lisans

    İngilizce

    İngilizce

    2020

    Elektrik ve Elektronik MühendisliğiBoğaziçi Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ İSMAİL FAİK BAŞKAYA

    PROF. DR. ARDA YURDAKUL

  5. Özelleştirilmiş analitik bulut mimarilerinde dağıtık dosya sistemleri ile performans iyileştirmesi

    Performance improvement via distribited file systems on private analytic clouds

    MUHAMMED AKİF AĞCA

    Yüksek Lisans

    Türkçe

    Türkçe

    2015

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolTOBB Ekonomi ve Teknoloji Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. ERDOĞAN DOĞDU