Geri Dön

Bulut bilişim sistemlerinde eşle/indirge yöntemi uygulanarak veri madenciliği yazılım çatısının geliştirilmesi

Development of data mining software framework by using map/reduce method in cloud computing systems

  1. Tez No: 353637
  2. Yazar: FERHAT ÖZGÜR ÇATAK
  3. Danışmanlar: PROF. DR. MEHMET ERDAL BALABAN
  4. Tez Türü: Doktora
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Büyük Veri, Destek Vektör Makinesi, Eşle/İndirge, Makine Öğrenmesi, Sosyal Medya, Big Data, Machine Learning, MapReduce, Social Media, Support Vector Machines
  7. Yıl: 2014
  8. Dil: Türkçe
  9. Üniversite: İstanbul Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Enformatik Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 173

Özet

Makine öğrenmesi, özellikle sınıflandırma ve regresyon problemlerinin çözümüne olanak sağlamaktadır. Makine öğrenmesi yöntemleri arasında destek vektör makinesi (DVM) algoritması yüksek genelleme özelliğinden dolayı en çok kullanılan sınıflandırma yöntemidir. Bununla beraber, DVM sınıflandırma algoritması yüksek boyutlu veri setleri için ihtiyaç duyduğu hesaplama gereksinimleri oldukça yüksektir.Bu çalışmada, çok sınıflı destek vektör makinesi algoritmasının bulut bilişim sistemleri üzerinde Eşle/İndirge tekniği ile eğitilmesi incelenmiştir. Bu çalışmayı dört bölüme ayırmak mümkündür. Birinci bölümde bulut bilişim sistemleri ile ilgili bilgi verilmektedir. Bulut sistemlerde yer alan servis modelleri, dağıtım modelleri, bilimsel araştırmalar için bulut bilişim sistemleri, fonksiyonel programlama ve Eşle/İndirge konuları incelenmiştir.İkinci bölümde, DVM algoritması incelenmektedir. DVM algoritmasının sınıflandırma ve regresyon problemlerinde kullanımı araştırılmıştır. Üçüncü bölümde DVM sınıflandırma algoritmasının Eşleİndirge (MapReduce) tekniği ile dağıtık mimari bulut bilişim sunucuları üzerinde yüksek boyutlu veri setlerinin eğitilmesi anlatılmaktadır. Bulut bilişim sistemlerinde oldukça sık kullanılan Eşleİndirge tekniğinin ve fonksiyonel programlamanın tarihsel gelişimi anlatılmaktadır.Dördüncü bölüm tezin uygulama kısmını oluşturmaktadır. İki kısımdan oluşmaktadır. Birinci kısımda California Irvine Üniversitesi (UCI) tarafından makine öğrenmesi için yayınlanan veri setlerinden yazı ve rakam tanımaya yönelik veri setleri kullanılarak, sadece ikili sınıflandırmaya izin veren DVM sınıflandırma algoritmasının, çok sınıflı sınıflandırma teknikleri ile uygulaması gösterilmektedir. İkinci aşamada Türkiye'de bulunan vakıf ve devlet üniversitelerinin sosyal medya mesaj veri seti ile sınıflandırılması yapılmıştır. Eşleİndirge tekniği ile ortaya çıkan modellerin testi için 10 parçalı çapraz doğrulama yöntemi uygulanarak, her yinelemedeki model iyileşmesi grafiklerle gösterilmiştir.

Özet (Çeviri)

Machine learning allows specially solution of classification and regression problems. Support vector machine algorithm (SVM) is the most commonly used classification method among machine learning techniques due to its high generalization property. However, SVM needs high computational requirements for high-dimensional datasets.In this study, multi-class support vector machine algorithm over cloud computing systems with MapReduce technique is studied. This work can be divided into four parts.In the first section, general information on cloud computing systems is provided. Service models, distribution models, cloud computing systems for scientific research, functional programming and MapReduce in cloud computing were examined.In the second part, SVM algorithm is analyzed. The use of SVM algorithm in classification and regression is studied. In the third part, SVM classification algorithm with MapReduce technique of training high-dimensional datasets on a distributed cloud computing system servers are described. The historical development of MapReduce technique and functional programming that commonly used in cloud computing systems is described.The fourth chapter of this thesis is the application part. It consists of two sections. In the first section, using text and digit classification datasets that is provided by University of Caroline Irvine (UCI) for machine learning, SVM classification algorithm that allows only binary classification is used for multi-class classification with some techniques. In the second section, social media posts data set of foundations and state universities in Turkey is classified. The models that are created with MapReduce are tested with 10-fold cross-validation technique and accuracy improvement of each iteration is shown with graphics.

Benzer Tezler

  1. Stacked job scheduling on virtual machines with containers in cloud computing systems

    Bulut bilişim sistemlerinde sanal makineler üzerinde taşıyıcılar ile yığın iş çizelgelemesi

    MUSTAFA AKIN

    Yüksek Lisans

    İngilizce

    İngilizce

    2016

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİhsan Doğramacı Bilkent Üniversitesi

    Bilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı

    DOÇ. DR. İBRAHİM KÖRPEOĞLU

  2. Tek kart bilgisayar kümeleri üzerinde bulut

    Cloud on single board computer clusters

    LEVENT AYSAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2015

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolTürk Hava Kurumu Üniversitesi

    Bilişim Teknolojileri Ana Bilim Dalı

    DOÇ. DR. İZZET GÖKHAN ÖZBİLGİN

  3. Bulut bilişim servis sağlayıcısının veri güvenliğinin sağlanmasından doğan sorumluluğu

    Liability of cloud computing service providers arising from the provision of data security

    HATİCE BENGİSU KOLAT

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    HukukMarmara Üniversitesi

    Hukuk Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ GEDİZ KOCABAŞ

  4. Bulut bilişimde veri güvenliği ve kriptografi

    Data security and cryptography in cloud computing

    HÜSEYİN ÖCAL

    Yüksek Lisans

    Türkçe

    Türkçe

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolMarmara Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. BAHATTİN YALÇINKAYA

  5. 6698 sayılı Kişisel Verilerin Korunması Kanunu çerçevesinde bulut bilişim sistemleri

    Cloud computing systems within the framework of the Personal Data Protection Law no. 6698

    DUYGU MAYA

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    HukukBahçeşehir Üniversitesi

    Özel Hukuk Ana Bilim Dalı

    DOÇ. DR. ELİF KÜZECİ EROL