Geri Dön

Sürü zekası yöntemleri ile Apache Spark destekli veri kümeleme

Data clustering with swarm intelligence methods supported Apache Spark

  1. Tez No: 670804
  2. Yazar: ŞÜHEDA SEMİH AÇMALI
  3. Danışmanlar: DR. ÖĞR. ÜYESİ YASİN ORTAKCI
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2021
  8. Dil: Türkçe
  9. Üniversite: Karabük Üniversitesi
  10. Enstitü: Lisansüstü Eğitim Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 70

Özet

Son yıllarda internet kullanımın artması ve her şeyin sanal ortamda saklanmasından dolayı, yüksek hacimli ve farklı türlerde (görüntü, ses, metin, sayısal değerler) veriler üretilmektedir. Bu verilerin büyük çoğunluğu etiketlenmemiş verilerden oluşmaktadır. Veri kümeleme işlemi veri madenciliğinin en önemli problemlerinden biridir. Bu problem, veri setini belirli bir sayıda farklı gruba bölen bir minimizasyon problemi olarak ele alınabilir. Bu tür minimizasyon problemlerinin çözümünde sıklıkla meta-sezgisel algoritmalar kullanılmaktadır. Bu çalışmada veri kümeleme probleminin çözümü için Armoni Arama (HS), Gri Kurt Optimizasyon (GWO) ve Yapay Alg Kolonisi (AAA) algoritmaları kullanılmıştır. Ayrıca büyük hacimli verilerin kümelemesi yapıldığı için Apache Spark teknolojisinin dağıtık hesaplama modeli işlem süresini kısaltmak için kullanılmıştır. Apache Spark mimari olarak sürücü ve işçi düğümlerden oluşur. Sürücü düğüm işlemleri dağıtmak, organize etmek ve toplama görevlerini üstlenirken, işçi düğümler verilen işlemi yapmak ve sürücü düğüme sonuçları vermekle görevlidirler. Yapılan testler sonucunda artan düğüm sayısının işlem süresini kısalttığı görülmektedir.

Özet (Çeviri)

In recent years, high volume and different types of data (image, sound, text, numerical values, etc.) are produced due to increasing internet usage and everything stored digitally. Most of these data consists of unlabeled data. Data labeling (clustering) is one of the most important problems of data mining. This problem can be considered as a minimization problem that divides the data into a certain number of different groups. Meta-heuristic algorithms are often used to solve such minimazition problems. In this thesis, harmony search, gray wolf optimizer, and artificial algae colony algorithms are used to solve this data clustering problem. In addition, the distributed computing model of Apach Spark is used to shorten the running time because large volume data is clustered. Apache Spark architecture consists of driver and worker nodes. The driver node takes over the tasks of distibuting, organizing, and aggregating processes, while the worker nodes are tasked to perform the given process and delivering results to the driver node. The results of the experimental studies revealed the increasing number of nodes shortens the running time.

Benzer Tezler

  1. 6 serbestlik dereceli robot kolun ters kinematik analizinin yapay zeka yöntemleri ile gerçekleştirilmesi

    Performance of inverse kinematics analysis of 6 degrees of freedom robotic arm using artificial intelligence methods

    TUĞÇE TURGUT AKSOY

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    Mekatronik MühendisliğiManisa Celal Bayar Üniversitesi

    Makine ve İmalat Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ SERKAN ÇAŞKA

    ÖĞR. GÖR. HACER ARIOL TAYMAZ

  2. Yapay arı kolonisi algoritması ile özellik seçimi

    Feature selection using artificial bee colony algorithm

    ZEHRA KIRAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKonya Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. AHMET BABALIK

  3. Sürü zekâsı optimizasyon algoritmaları ile iç mekân konumlandırma

    Indoor positioning with swarm intelligence optimization algorithms

    YASİN KAM

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    Elektrik ve Elektronik MühendisliğiAkdeniz Üniversitesi

    Elektrik ve Elektronik Mühendisliği Ana Bilim Dalı

    PROF. DR. ÜMİT DENİZ ULUŞAR

  4. Tree-based machine learning methods combined with swarm intelligence feature selection for intrusion detection

    Saldırı tespiti için sürü zekası özellik seçimi ile birleştirilmiş ağaç tabanlı makine öğrenimi yöntemleri

    EMRA DEMİR

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAdana Alparslan Türkeş Bilim Ve Teknoloji Üniversitesi

    Bilişim Teknolojileri Ana Bilim Dalı

    DOÇ. DR. YASİN KAYA

  5. Sürü zekası yaklaşımlarının renkli görüntü kesimlemeye uyarlanması ve tanıma sistemleri üzerinde gerçekleştirimi

    Adaptation of swarm intelligence approaches into color image segmentation and their implementations on recognition systems

    DOĞAN AYDIN

    Doktora

    Türkçe

    Türkçe

    2011

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolEge Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. AYBARS UĞUR