Geri Dön

A comparative study of Hadoop and Spark frameworks

Hadoop ve Spark sistemlerin karşılastırmalı çalışması

  1. Tez No: 449314
  2. Yazar: ARSAN MOHAMMED ALI ALI
  3. Danışmanlar: PROF. DR. ALİ YAZICI, YRD. DOÇ. DR. ZİYA KARAKAYA
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2016
  8. Dil: İngilizce
  9. Üniversite: Atılım Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Yazılım Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 75

Özet

Bu çalışma, büyük veri sistemlerden ikisi olan Hadoop ve Spark'ı karşılaştırarak incelemektedir. Bu çalışmaya dahil edilen sistemler ideal performanslarını gösterebilecek şekilde çeşitli parametrelerle ayarlanmış; performans, donanım kullanımları ve kullanılan donanım sayısının arttırılmasıyla oluşan hızlanma oranları dört farklı uygulamada değerlendirilmiştir. Değerlendirme sonuçları incelendiğinde Spark'ın WordCount ve Sort uygulamaları için daha iyi performans gösterdiği, Hadoop'un Naive-Bayes uygulamasında Spark'tan daha başarılı olduğu gözlenmiştir. Bununla beraber, Grep uygulaması için Hadoop ve Spark arasında göze değer bir fark görülmemiştir.

Özet (Çeviri)

In this thesis, Apache Hadoop and Apache Spark are compared with respect to performance, resource usage, and speedups of four different Big Data workloads. The comparison is done by tuning the parameters with various combinations for the optimum performance of each framework. The evaluations show that, Spark outperforms Hadoop for WordCount, and Sort workloads. However, Hadoop outperforms Spark in Naive-Bayes workload, and there is no a remarkable difference in the performances for Grep workload.

Benzer Tezler

  1. Türkçe tweetlerin analiz edilebilmesi için hadoop/hive kullanan melez bir sistemin geliştirilmesi

    Development of a hybrid system using hadoop/hive for analyzing Turkish tweets

    SİNAN KUL

    Doktora

    Türkçe

    Türkçe

    2018

    İşletmeAtatürk Üniversitesi

    Yönetim Bilişim Sistemleri Ana Bilim Dalı

    PROF. DR. ÜSTÜN ÖZEN

  2. Comparative performance evaluation of hadoop on PaaS proposals by leveraging HiBench

    PaaS temelli hadoop tekliflerinin HiBench kullanılarak karşılaştırmalı performans değerlendirmesi

    ULUER EMRE ÖZDİL

    Yüksek Lisans

    İngilizce

    İngilizce

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBahçeşehir Üniversitesi

    Büyük Veri Analitiği ve Yönetimi Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ SERKAN AYVAZ

  3. Hocazade ve Ali Tusi'nin tehafütlerinin mukayesi

    A Comparative study of Ali Tusi and Hocazade's tahafut's

    GÜRBÜZ DENİZ

    Doktora

    Türkçe

    Türkçe

    1999

    DinAnkara Üniversitesi

    Felsefe ve Din Bilimleri Ana Bilim Dalı

    PROF. DR. HAYRANİ ALTINTAŞ

  4. A Comparative study of artificial neural network and the alternative statistical methods

    Yapay sinir ağları ve alternatif istatistik metodlarının karşılaştırmalı çalışması

    FERAY ADIGÜZEL

    Yüksek Lisans

    İngilizce

    İngilizce

    1999

    İstatistikOrta Doğu Teknik Üniversitesi

    İstatistik Ana Bilim Dalı

    YRD. DOÇ. DR. QAMARUL İSLAM

  5. n < p boyutlu biyolojik verilerde farklı kümeleme yöntemlerinin karşılaştırmalı olarak incelenmesi

    A comparative study of different clustering methods on the biological data with n

    İRFAN ÖZTÜRK

    Doktora

    Türkçe

    Türkçe

    1999

    ZiraatHarran Üniversitesi

    Zootekni Ana Bilim Dalı

    PROF. DR. NECATİ YILDIZ