Geri Dön

Hadoop mapreduce algoritmasının analizi ile performansa etki eden parametrelerin tespiti ve hadoop üzerinde başarım artımı

With analysis of hadoop mapreduce algorithm finding parameters affecting performance and using optimized parameters increasing throughput on hadoop cluster

  1. Tez No: 397351
  2. Yazar: HÜSEYİN ŞARKIŞLA
  3. Danışmanlar: YRD. DOÇ. DR. HAYRETTİN EVİRGEN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Hadoop, Map reduce, Hdfs, Mapreduce Performans Parametreleri, Hadoop, Map Reduce, Hdfs, Map Reduce Performance Parameters
  7. Yıl: 2015
  8. Dil: Türkçe
  9. Üniversite: Sakarya Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar ve Bilişim Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Bilişim Bilim Dalı
  13. Sayfa Sayısı: 66

Özet

Map reduce kütüphanesi Google tarafından bilişim dünyasına kazandırılan dağıtık mimari üzerinde çok büyük verilerin kolay bir şekilde analiz edilebilmesini sağlayan programlama modelidir. Bu doküman hadoop map reduce algoritması iş akışını inceler ve map reduce işlemlerinin ve yapılandırma parametrelerinin farklı aşamalardaki farklı kullanımını ve yapılandırma parametrelerinin varsayılan değerleri, artıları eksileri ve tavsiye edilen“Konfigürasyon Parametre Modeli”'ni açıklar. Uygulamaya özgü“Konfigürasyon Parametre Modeli”ni oluşturmak için uygulama ortamı düğümler arasında koordinasyonu sağlayan bir bilgisayar ve verilerin saklandığı dört adet bilgisayar olmak üzere toplam beş bilgisayardan oluşmuş, her bir bilgisayar 1 gb/s ile haberleşen anahtar ile birbirine bağlanmış ve hadoop küme yapısı oluşturulmuştur. Deneyde yapılan testler ile parametreler için en uygun değer değerler tespit edilmiştir. Amacımız az donanım maliyeti ile ölçekleme yaparak hadoop map reduce sistemi için en uygun değer yapılandırma parametrelerini bulup tavsiye edilen“Konfigürasyon Parametre Modeli”' ni açığa çıkarmaktır.

Özet (Çeviri)

Map reduce framework is a programming model brought to information world by Google that enables very large data analyzed in easy way on distributed architecture. This study analyses hadoop map reduce algorithm in a way that it describes different phases of map reduce operations, usage of configuration parameters in the map reduce job. It explains the configuration parameters, their default values, advantages, disadvantages, and creates a“Configuration Parameter Model”with suggested values in different conditions for this cluster. In order to create Configuration Parameter Model, hadoop map reduce cluster is created on environment for experiment which has five computers and has got one main computer which enables coordinating with master node and four computers which are slave nodes. The experiments are made on parameters which is trouble for cluster, optimum parameters values detected made by running tests. Our goal is to expose suggested“Configuration Parameter Model”by finding optimum configuration parameters using cluster and by decreasing hardware cost minimum.

Benzer Tezler

  1. Büyük veri analizi yöntemleri ve yazılım teknolojileriyle metin madenciliği

    Text mining using big data analysis methods and tools

    EVREN PALA

    Yüksek Lisans

    Türkçe

    Türkçe

    2016

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHava Harp Okulu Komutanlığı

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. GÜRAY YILMAZ

  2. Dağıtık görüntü işleme

    Distributed image processing

    MURAT TEZGİDER

    Yüksek Lisans

    Türkçe

    Türkçe

    2017

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolFırat Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. GALİP AYDIN

  3. Social media data filtering and analysis using mapreduce programming model

    Mapreduce programlama modelini kullanarak sosyal medya veri filtreleme ve analizi

    ÜMİT DEMİRBAGA

    Yüksek Lisans

    İngilizce

    İngilizce

    2017

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolNewcastle University

    Bilgisayar Bilimleri Ana Bilim Dalı

    DR. RAJİV RANJAN

  4. Büyük veri araçlarından Hadoop kullanarak veri madenciliği

    Data mining using Hadoop big data tool

    MEHMET UMUT SALUR

    Yüksek Lisans

    Türkçe

    Türkçe

    2016

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolPamukkale Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. SEZAİ TOKAT

  5. Gezgin satıcı probleminin hadoop üzerinde çalışan paralel genetik algoritma ile çözümü

    Parallel genetic algorithm to solve traveling salesman problem on hadoop cluster

    HARUN RAŞİT ER

    Yüksek Lisans

    Türkçe

    Türkçe

    2013

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. NADİA ERDOĞAN