Geri Dön

A matched-pair comparative study on classification of data streams with concept drift

İçerik kayması bulunan akışkan verilerin sınıflandırılmasında eşleştirmeli karşılaştırma çalışması

  1. Tez No: 537372
  2. Yazar: ELİF SELEN BABÜROĞLU
  3. Danışmanlar: DOÇ. DR. ALPTEKİN DURMUŞOĞLU, PROF. DR. TÜRKAY DERELİ
  4. Tez Türü: Yüksek Lisans
  5. Konular: Endüstri ve Endüstri Mühendisliği, Industrial and Industrial Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2019
  8. Dil: İngilizce
  9. Üniversite: Gaziantep Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Endüstri Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 114

Özet

Giderek artan oranda“nesnelerin interneti”alanları, sosyal medya uygulamaları, donanım cihazları ve benzeri kaynaklar hayret verici oranda veri üretmektedir. Heterojen kaynaklardan sürekli olarak gelen bu veriye akışkan veri denmektedir. Akışkan veri madenciliği yalnızca aniden popüler olan bir çalışma alanı değil aynı zamanda da karmaşık bir konudur. Akışkan verinin dinamik, sınırsız, yüksek boyutlu ve hızla gelişen yapısından dolayı eski ve geleneksel veri madenciliği teknikleri yetersiz kalmıştır. Gerçek hayatta karşılaşılan; ağ saldırılarının tespit edilmesi, hava tahminleri, istenmeyen e-postaların filtrelenmesi, hırsızlık tespit olayları ve benzeri problemlerde akışkan veriler kullanılmaktadır. Geniş hacimli akışkan verilerde gerçekleştirilen çevrimiçi öğrenme yöntemleri sıklıkla öngörülemeyen bir şekilde kaymaların oluşması ile sonuçlanmaktadır. Bu fenomene içerik kayması denmekte ve bu kaymalar akışkan çalışma veri setinden öğrenilen modeli güvensiz kılmaktadır. İçerik kayması tespit yöntemleri arasında bulunan algılayıcılar, kaymanın oluştuğu yeri ve zamanı tespit ederek sınıflandırma yöntemlerini değiştirerek sınıflandırmanın doğruluğunu yükseltmeye çalışmaktadır. Bu çalışma 13 kavram kayması tespit yöntemi [DDM, EDDM, ADWIN, CUSUM, GMA, PageHinkley, ECDD, HDDMA, HDDMW, SEQDRIFT2, STEPD, RDDM and SEED] ve 8 sınıflandırma yöntemi [NaiveBayes(NB), HoeffdingTree(HT), HoeffdingOption Tree, Perceptron(PR), OzaBagASHT, OzaBagADWIN, Decision Stump(DS), and k-Nearest Neighbor(kNN)] arasında eşleştirmeli bir karşılaştırma yapmaktadır. Analizler yapay veri setleri kullanılarak Massive Online Analysis (MOA) yazılımında gerçekleştirilmiştir.

Özet (Çeviri)

Increasingly, the Internet of Things (IoT) realms, social media applications, hardware devices and etc. generate data at an astonishing rate. These continuously incoming data from heterogeneous sources is referred to as data stream. Data stream mining is not only an urgent trend topic but also entangled. The dynamic, unbounded, high-dimensional and rapidly evolving structure of stream data rendered traditional data mining techniques insufficient. The real-world applications particularly involve real-time streams in an evolving environment; network intrusion detection, weather prediction, spam e-mail filtering, fraud detection, etc. Online learning derives information from the large volume of stream data, usually affected by the changes in the underlying distribution; often in unforeseen ways. This phenomenon, called as concept drift, makes formerly learned models insecure and imprecise in classification manner. As a handling method, concept drift detectors attempt to estimate the position of concept drift in data streams in order to substitute the base learner after drift has occurred and try to improve overall accuracy. This study propose a matched-pair comparison between 13 drift detectors [DDM, EDDM, ADWIN, CUSUM, GMA, PageHinkley, ECDD, HDDMA, HDDMW, SEQDRIFT2, STEPD, RDDM, and SEED] and 8 classifiers as base learners [Naive Bayes(NB), HoeffdingTree(HT), HoeffdingOptionTree, Perceptron(PR), OzaBagASHT, OzaBagADWIN, Decision Stump(DS), and k-Nearest Neighbor(kNN)]. In parallel with the aim of thesis, pairs (classifier, detector) with higher accuracy scores are recommended. The experimental evaluation is conducted on Massive Online Analysis (MOA) software.

Benzer Tezler

  1. Üç boyutlu yüz tanımada lokal özellik temelli yöntemlerin kullanımı ve karşılaştırılması

    Comparison and usage of local feature based methods for 3d face recognition

    MUHAMMED ENES ATİK

    Yüksek Lisans

    Türkçe

    Türkçe

    2018

    Jeodezi ve Fotogrametriİstanbul Teknik Üniversitesi

    Geomatik Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ZAİDE DURAN

  2. İntrakraniyal anevrizmaların endovasküler tedavisinde Micrus Cerecyte koyiller ile standart koyillerin karşılaştırılması

    The comparation of bioactive Micrus Cerecyte coils with standart bare platinum coils in endovascular treatmant of intracranial aneurysms

    ÖZGÜR ERTUĞRUL

    Tıpta Uzmanlık

    Türkçe

    Türkçe

    2009

    Radyoloji ve Nükleer TıpHacettepe Üniversitesi

    Radyoloji Ana Bilim Dalı

    PROF. DR. SARUHAN ÇEKİRGE

  3. Superpixel based efficient image representation for segmentation and classification

    Bölütleme ve sınıflandırma için süperpiksel temelli etkin imge simgeleme

    HÜSEYİN EMRAH TAŞLI

    Doktora

    İngilizce

    İngilizce

    2013

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    PROF. DR. ABDULLAH AYDIN ALATAN

  4. Böbrek taşı tedavisinde prone ve supin mini perkütan nefrolitotomi yöntemlerinin etkinlik, güvenilirliğinin karşılaştırılması: 1:1 eşleştirmeli analiz

    Comparison of the efficacy and safety of mini percutaneous nephrolithotomy in renal stone treatment under the prone and supine position: a matched-pair analysis

    HARUN ÖZDEMİR

    Tıpta Uzmanlık

    Türkçe

    Türkçe

    2018

    ÜrolojiSağlık Bilimleri Üniversitesi

    Üroloji Ana Bilim Dalı

    DOÇ. DR. MEHMET FATİH AKBULUT

    UZMAN AKİF ERBİN

  5. Hopf-cyclic cohomology of bicrossed product Hopf algebras

    Başlık çevirisi yok

    SERKAN SÜTLÜ

    Doktora

    İngilizce

    İngilizce

    2012

    MatematikUniversity of New Brunswick

    DR. BAHRAM RANGIPOUR