Big data frameworks performance evaluation
Büyük veri kütüphanelerinin performans değerlendirmesi
- Tez No: 540433
- Danışmanlar: DR. ÖĞR. ÜYESİ BETÜL ERDOĞDU ŞAKAR
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2018
- Dil: İngilizce
- Üniversite: Bahçeşehir Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 69
Özet
Son yılların en popüler öğelerinden biri Big Data'dır. Büyük Veri hayatımızın ilk günlerinden hayatımıza girmeye başladı, aslında teknoloji ile birlikte hayatımıza girmeye başladı. Bilgisayarda yaptığımız her işlemde, Facebook'ta, Twitter paylaşımında, ziyaret ettiğimiz web sayfasında, doldurduğumuz müşteri formunda vb. gerçek, veriyi girdiğimiz her yerde Büyük Veriyi yarattık. Herkes Büyük Veri kullanıyor ve bu işlemin her türlü Büyük Veri işleme çerçevesinin ele alabileceği bir dereceye kadar soyutlanabileceği ortaya çıkıyor. Bu çerçevelerden bazıları Apache Hadoop, Apache Spark ve Apache Flink olarak bilinir. Bu tez çalışmasında, performans analizi ve değişen sayılarda köle düğümler ile farklı algoritma ve veri büyüklükleri kullanılarak performansın değerlendirilmesi için seçilen çerçeve seçilmiştir. Sonuç olarak Flink ve Spark, performanslarının Hadoop'tan daha verimli olduğunu kanıtladı.
Özet (Çeviri)
One of the most popular items of recent years is Big Data. Big Data has started to enter our life from the very first days of our life, in fact when technology begin to enter into our lives. In every process we do on the computer, in Facebook, twitter sharing, in the customer form we fill, on the web page we visited, etc. In fact, we created Big Data everywhere we entered data without realizing it. Everyone is using Big Data, and it brings forth that this process can be allocated to a level that can be dealt with by all kind of Big Data processing frameworks. Some of these frameworks are quite popular as Apache Hadoop, Apache Spark and Apache Flink. In this thesis the mentioned framework is chosen for performance analysis and using different algorithms with different number of slave nodes and data sizes the evaluation of performance is done. As a result, Flink and Spark proved themselves that they are more efficient in performance than Hadoop.
Benzer Tezler
- Sentiment analysis in social media: A comparative study
Sosyal medyada duygu analizi : Karşılaştırmalı bir çalışma
YASMIN TESFALDET GEBREYESUS
Yüksek Lisans
İngilizce
2018
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAtılım ÜniversitesiYazılım Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. ZİYA KARAKAYA
PROF. DR. ALİ YAZICI
- Real-time performance diagnosis and evaluation of big data systems in cloud datacenters
Bulut veri merkezlerinde büyük veri sistemlerinin gerçek zamanlı performans teşhisi ve değerlendirilmesi
ÜMİT DEMİRBAGA
Doktora
İngilizce
2021
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolNewcastle UniversityBilgisayar Bilimleri Ana Bilim Dalı
PROF. DR. RAJIV RANJAN
- Yüklenici inşaat firmaları için çok kriterli performans ölçme modeli
Multi-criteria performance measurement model for construction contractors
IŞILAY TEKÇE
- A comparative study of Hadoop and Spark frameworks
Hadoop ve Spark sistemlerin karşılastırmalı çalışması
ARSAN MOHAMMED ALI ALI
Yüksek Lisans
İngilizce
2016
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAtılım ÜniversitesiYazılım Mühendisliği Ana Bilim Dalı
PROF. DR. ALİ YAZICI
YRD. DOÇ. DR. ZİYA KARAKAYA
- Sanal ve artırılmış gerçeklik teknolojisinin yatırım ve işletme maliyetine etkisi. Talaşlı imalat yatırımı üzerine uygulama örneği
The effect of virtual and augmented reality technology on investment and operating cost. Application example on machining investment
İBRAHİM MURAD
Yüksek Lisans
Türkçe
2022
İşletmeİstanbul Teknik Üniversitesiİşletme Ana Bilim Dalı
DOÇ. DR. NİHAN YILDIRIM