Geri Dön

Implementation of data mining techniques in cloud computing

Bulut bilişimde veri madenciliği tekniklerinin geliştirilmesi

  1. Tez No: 410570
  2. Yazar: PELİN YILDIRIM
  3. Danışmanlar: YRD. DOÇ. DR. DERYA BİRANT
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2015
  8. Dil: Türkçe
  9. Üniversite: Dokuz Eylül Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 80

Özet

Son yıllarda teknolojide meydana gelen yenilikler ve gelişmeler sebebi ile veri miktarında oldukça büyük artış gözlenmektedir. Her gün dünya genelinde milyonlarca veri üretilmekte ve verilerin boyutları terabaytlardan petabaytlara kadar ulaşmaktadır. Bu durum, büyük ve karmaşık veriler üzerinden gizli anlamsal bilgilerin çıkarılması zorunluluğunu beraberinde getirmiştir. Dolayısıyla, bu tez potansiyel yararlı bilgilerin, büyük veri tabanlarından veri madenciliği teknikleri kullanılarak keşfedilmesi üzerine yoğunlaşmaktadır. Yüksek boyuta sahip verilerin saklanması, bu veriler üzerinde analitik işlemlerin gerçekleştirilerek istenen yararlı bilgiye ulaşılması ve geleceğin tahminlenmesi maliyetli ve zor bir işlemdir. Bu sebeple, bu tezde, büyük miktarda veri üzerindeki bulut bilişim tabanlı bilgi keşfi operasyonları etkin, düşük maliyetli ve her yerden ulaşılabilir bir şekilde gerçekleştirilmektedir. Bu tezde veri madenciliği ve bulut bilişim kavramlarından bahsedilmiş ve kullanılan veri madenciliği metotları açıklanmıştır. Sınıflandırma, kümeleme ve birliktelik kuralı analizi metotlarının farklı veri setleri üzerinde uygulanması amacıyla DMCC isimli bir sistem geliştirilmiş ve bulut ortamında barındırılmaktadır. Bu tez aynı zamanda Naive Bayes sınıflandırıcı için farklı sayısal olasılık dağılım teknikleri ve farklı dağılım türlerini farklı nitelikler üzerinde uygulayarak sınıflandırma için yeni bir yaklaşım sunan NBC4D isimli yeni bir method önermektedir. Deneysel sonuçlar gösteriyor ki, önerilen metot sadece tek dağılım türünün kullanımı ile kıyaslandığında gerçek veri setleri üzerinde başarıya sahiptir.

Özet (Çeviri)

By reason of the fact that innovations and developments are occurred in technology of late years, massive increase of data amount is monitored. Millions of data are produced around the world daily and size of data reach from terabytes to petabytes. This situation brings necessity of finding hidden and semantic information from huge and complex data with it. Therefore, this thesis focusses on the discovery of potentially useful knowledge from large databases by using data mining techniques. Storing large sized data, reaching desired useful information by applying analytical operations on data and predicting future are costly and difficult processes. For this reason, in this thesis, cloud computing based knowledge discovery operations on huge amount of data is performed efficiently, affordable and accessible in everywhere. In this thesis, data mining and cloud computing concepts are mentioned and used data mining methods are explained. A novel system called DMCC was developed and hosted on cloud platform to apply classification, clustering and association rule mining techniques on different data sets. This thesis also proposes different continuous probability distribution techniques for Naive Bayes classification and a novel method named NBC4D which offers a new approach for classification by applying different distribution types on different attributes. The experimental results show that our proposed method has success on real-world datasets when compared with the usage of only one distribution type.

Benzer Tezler

  1. Digital oil refinery: Utilizing real-time analytics and cloud computing over industrial sensor data

    Başlık çevirisi yok

    ATHAR KHODABAKHSH

    Doktora

    İngilizce

    İngilizce

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolÖzyeğin Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. İSMAİL ARI

  2. Parallelization of K-means and DBSCAN clustering algorithms on a HPC cluster

    DBSCAN ve K-means kümeleme algoritmalarının bir HPC kümesi üzerinde paralelleştirilmesi

    HUNAIN DURRANI

    Yüksek Lisans

    İngilizce

    İngilizce

    2013

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. AHMET COŞAR

  3. Data analysis with distributed machine learning methods in smart city applications

    Akıllı şehir uygulamalarında dağıtık makine öğrenmesi yöntemleriyle veri analizi

    NAWAF ABDULLA

    Doktora

    İngilizce

    İngilizce

    2024

    Yönetim Bilişim SistemleriGazi Üniversitesi

    Bilişim Sistemleri Ana Bilim Dalı

    DOÇ. DR. MEHMET DEMİRCİ

    PROF. DR. SUAT ÖZDEMİR

  4. Assessment of water quality and aquatic diversity of an open-pit gold mine area using random forest algorithm with Google Earth engine

    Google Earth engine ile rastgele orman algoritması kullanılarak açık ocak altın madeni su kalitesi ve sucul canlılık çeşitliliğinin değerlendirilmesi

    ŞENER ALKAN

    Yüksek Lisans

    İngilizce

    İngilizce

    2020

    Jeodezi ve Fotogrametriİstanbul Teknik Üniversitesi

    Geomatik Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ESRA ERTEN

  5. Sosyal medya lokasyon analizi

    Social media location analysis

    YAHYA ALALI

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSakarya Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. NİLÜFER YURTAY