Implementation of data mining techniques in cloud computing
Bulut bilişimde veri madenciliği tekniklerinin geliştirilmesi
- Tez No: 410570
- Danışmanlar: YRD. DOÇ. DR. DERYA BİRANT
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2015
- Dil: Türkçe
- Üniversite: Dokuz Eylül Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 80
Özet
Son yıllarda teknolojide meydana gelen yenilikler ve gelişmeler sebebi ile veri miktarında oldukça büyük artış gözlenmektedir. Her gün dünya genelinde milyonlarca veri üretilmekte ve verilerin boyutları terabaytlardan petabaytlara kadar ulaşmaktadır. Bu durum, büyük ve karmaşık veriler üzerinden gizli anlamsal bilgilerin çıkarılması zorunluluğunu beraberinde getirmiştir. Dolayısıyla, bu tez potansiyel yararlı bilgilerin, büyük veri tabanlarından veri madenciliği teknikleri kullanılarak keşfedilmesi üzerine yoğunlaşmaktadır. Yüksek boyuta sahip verilerin saklanması, bu veriler üzerinde analitik işlemlerin gerçekleştirilerek istenen yararlı bilgiye ulaşılması ve geleceğin tahminlenmesi maliyetli ve zor bir işlemdir. Bu sebeple, bu tezde, büyük miktarda veri üzerindeki bulut bilişim tabanlı bilgi keşfi operasyonları etkin, düşük maliyetli ve her yerden ulaşılabilir bir şekilde gerçekleştirilmektedir. Bu tezde veri madenciliği ve bulut bilişim kavramlarından bahsedilmiş ve kullanılan veri madenciliği metotları açıklanmıştır. Sınıflandırma, kümeleme ve birliktelik kuralı analizi metotlarının farklı veri setleri üzerinde uygulanması amacıyla DMCC isimli bir sistem geliştirilmiş ve bulut ortamında barındırılmaktadır. Bu tez aynı zamanda Naive Bayes sınıflandırıcı için farklı sayısal olasılık dağılım teknikleri ve farklı dağılım türlerini farklı nitelikler üzerinde uygulayarak sınıflandırma için yeni bir yaklaşım sunan NBC4D isimli yeni bir method önermektedir. Deneysel sonuçlar gösteriyor ki, önerilen metot sadece tek dağılım türünün kullanımı ile kıyaslandığında gerçek veri setleri üzerinde başarıya sahiptir.
Özet (Çeviri)
By reason of the fact that innovations and developments are occurred in technology of late years, massive increase of data amount is monitored. Millions of data are produced around the world daily and size of data reach from terabytes to petabytes. This situation brings necessity of finding hidden and semantic information from huge and complex data with it. Therefore, this thesis focusses on the discovery of potentially useful knowledge from large databases by using data mining techniques. Storing large sized data, reaching desired useful information by applying analytical operations on data and predicting future are costly and difficult processes. For this reason, in this thesis, cloud computing based knowledge discovery operations on huge amount of data is performed efficiently, affordable and accessible in everywhere. In this thesis, data mining and cloud computing concepts are mentioned and used data mining methods are explained. A novel system called DMCC was developed and hosted on cloud platform to apply classification, clustering and association rule mining techniques on different data sets. This thesis also proposes different continuous probability distribution techniques for Naive Bayes classification and a novel method named NBC4D which offers a new approach for classification by applying different distribution types on different attributes. The experimental results show that our proposed method has success on real-world datasets when compared with the usage of only one distribution type.
Benzer Tezler
- Digital oil refinery: Utilizing real-time analytics and cloud computing over industrial sensor data
Başlık çevirisi yok
ATHAR KHODABAKHSH
Doktora
İngilizce
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolÖzyeğin ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. İSMAİL ARI
- Parallelization of K-means and DBSCAN clustering algorithms on a HPC cluster
DBSCAN ve K-means kümeleme algoritmalarının bir HPC kümesi üzerinde paralelleştirilmesi
HUNAIN DURRANI
Yüksek Lisans
İngilizce
2013
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. AHMET COŞAR
- Data analysis with distributed machine learning methods in smart city applications
Akıllı şehir uygulamalarında dağıtık makine öğrenmesi yöntemleriyle veri analizi
NAWAF ABDULLA
Doktora
İngilizce
2024
Yönetim Bilişim SistemleriGazi ÜniversitesiBilişim Sistemleri Ana Bilim Dalı
DOÇ. DR. MEHMET DEMİRCİ
PROF. DR. SUAT ÖZDEMİR
- Assessment of water quality and aquatic diversity of an open-pit gold mine area using random forest algorithm with Google Earth engine
Google Earth engine ile rastgele orman algoritması kullanılarak açık ocak altın madeni su kalitesi ve sucul canlılık çeşitliliğinin değerlendirilmesi
ŞENER ALKAN
Yüksek Lisans
İngilizce
2020
Jeodezi ve Fotogrametriİstanbul Teknik ÜniversitesiGeomatik Mühendisliği Ana Bilim Dalı
DOÇ. DR. ESRA ERTEN
- Sosyal medya lokasyon analizi
Social media location analysis
YAHYA ALALI
Yüksek Lisans
Türkçe
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSakarya ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. NİLÜFER YURTAY