Geri Dön

Özelleştirilmiş analitik bulut mimarilerinde dağıtık dosya sistemleri ile performans iyileştirmesi

Performance improvement via distribited file systems on private analytic clouds

  1. Tez No: 409937
  2. Yazar: MUHAMMED AKİF AĞCA
  3. Danışmanlar: PROF. DR. ERDOĞAN DOĞDU
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2015
  8. Dil: Türkçe
  9. Üniversite: TOBB Ekonomi ve Teknoloji Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
  13. Sayfa Sayısı: 69

Özet

Teknoloji ve sosyal medyanın hızlı gelişimiyle veri hızı, hacmi ve çeşitliliği artış göstermektedir. Biriken veriye anlık olarak erişim ve karar desteği sağlanması mevcut teknolojiler ile mümkün olmamaktadır. Toplanan verilerin anlık olarak analiz edilmesi ve metin verilerinden bilgi çıkarımları standart veri tabanları ile yapılamamaktadır. Mevcut çözüm ve yöntemler de Türkçe metin için kısıtlı analiz yetenekleri bulunmaktadır. Bu çalışmada veri yoğun, işlemci yoğun uygulamalar için özelleştirilmiş dağıtık analitik sistem ve uygulamaları geliştirilmektedir. Bu sistemde dağıtık dosya sistemlerinin kullanımı ile performans iyileştirmeleri yapılmıştır. Tasarlanmış olan tek düğümlü ve çok düğümlü sistemlerde performans iyileştirmeleri gözlemlenmiştir. Dağıtık analitik sistemin dağıtık dosya sistemleriyle tasarlanmasıyla hızlı sonuçlar elde edilebileceği gözlemlenmiştir. Mikroblog metin analitiği için özelleştirilmiş platformda farklı algoritmaların performans ve doğruluk değerlendirmeleri yapılmıştır. Mikroblog metin analitiği için dağıtık skorlama algoritmasının k-means kümeleme algoritmasına göre daha hızlı çalıştığı gözlemlenmiştir. Metin analitiği için geliştirilmiş dağıtık algoritmalar tek düğümlü ve çok düğümlü sistemlerde performans olarak karşılaştırılmıştır. Küme performansında bellek kısıtlarının kritikliği gözlemlenmiş ve sistemin bellek ihtiyaçları değerlendirilmiştir. Geliştirilen dağıtık analitik sistem sayesinde büyük verinin hızlı sorgulanmasına imkân sağlanmaktadır. Uygulamalar için jenerik ve ölçeklenebilir depolama katmanları sağlanmaktadır. Dağıtık analitik uygulamalar için dağıtık mimari kullanımı önerilmektedir. Dağıtık dosya sistemlerinin ölçeklenebilir otomatik düğüm ekleme çıkarma özellikleri sayesinde donanımlar maksimum verimlilikte kullanılmakta ve ölçekleme minimum donanım ve zaman maliyeti ile yapılabilmektedir. Sonuç olarak, dağıtık dosya sistemlerinin özelleştirilmiş analitik bulut mimariler üzerinde analitik işlemler için önemli performans iyileştirmeleri sağladığı ve analitik işlemler için verimliliği arttırdığı gözlemlenmiştir.

Özet (Çeviri)

Improvements on current technologies and social media cause increase in data volume, variety, and velocity. Instant access to stored data and providing decision support is very hard with current technologies. Standard data base technologies cannot analyze the data and retrieve information from text data. Current solutions and methodologies have restricted analysis capabilities for Turkish texts. In this study a distributed analytical system and applications are developed for data bound and CPU bound applications. Performance improvements via distributed file systems are implemented on the system. The improvements are observed on single node and multi node systems. Faster results are obtained via distributed file systems on distributed analytical system. Different algorithms are evaluated in terms of performance and correctness for microblog text analytics on private distributed analytical system. Distributed scoring algorithm gives faster results than k-means clustering algorithm for microblog text analytics. The distributed algorithms developed for text analytics are implemented on single node and multi node systems and compared in terms of cluster performance. Memory constraints are observed on cluster performance and minimum memory requirement of the system is evaluated. Faster querying on big data is provided via the distributed analytical system. Generic and scalable storage layer is provided for applications. Distributed architecture usage is proposed for distributed analytical applications. Hardware can be used with maximum efficiency, and node replacement can be done at minimum time and minimum hardware cost with the scalability and automated node replacement features of distributed file systems. To sum up, it is observed that distributed file systems provide important performance improvements and improve efficiency for analytical operations on private analytical clouds.

Benzer Tezler

  1. Effective integration of data mining techniques with businessintelligence using web mining

    Başlık çevirisi yok

    OMER MUNEAM MUSHREF

    Yüksek Lisans

    İngilizce

    İngilizce

    2019

    Elektrik ve Elektronik MühendisliğiAltınbaş Üniversitesi

    Elektrik ve Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. OSMAN NURİ UÇAN

  2. Clustering and recommendation system on Turkey hotel dataset

    Türkiye otel verileri üzerinde kümeleme ve öneri sistemi

    ÖMER ARİFOĞULLARI

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGalatasaray Üniversitesi

    Veri Bilimi Ana Bilim Dalı

    DOÇ. DR. GÜNCE KEZİBAN ORMAN

  3. Belgesel kısa film: ?Deneyimleme?

    Short documentary film: ?Expreciency?

    AHMET ERDAL

    Yüksek Lisans

    Türkçe

    Türkçe

    2008

    Sahne ve Görüntü SanatlarıBeykent Üniversitesi

    Sinema Televizyon Ana Sanat Dalı

    YRD. DOÇ. DR. BURAK BUYAN

  4. Application of zirconium nanoparticles and graphene oxide functionalized iron nanocomposites for the determination of different organic and inorganic analytes

    Çeşitli organik ve inorganik analitlerin tayinlerinde grafen oksit ile fonksiyonlandırılmış demir nanokompozitler ve zirkonyum nanopartiküllerin uygulamaları

    ZEYNEP TEKİN

    Yüksek Lisans

    İngilizce

    İngilizce

    2021

    KimyaYıldız Teknik Üniversitesi

    Kimya Ana Bilim Dalı

    PROF. DR. SEZGİN BAKIRDERE

    DR. NİZAMETTİN ÖZDOĞAN

  5. Analitik hiyerarşi prosesi yaklaşımı kullanılarak mobilya sektöründe pazar bölümlendirme ve İç Anadolu Bölgesinden hedef pazar seçimi

    Market segmentation in the furniture industry and target market selection from the Central Anatolia Region using the analytical hierarchy process approach'

    ALİ TETİK

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    İşletmeKayseri Üniversitesi

    İşletme Ana Bilim Dalı

    PROF. DR. ÖZGÜR DEMİRTAŞ