Geri Dön

A matched-pair comparative study on classification of data streams with concept drift

İçerik kayması bulunan akışkan verilerin sınıflandırılmasında eşleştirmeli karşılaştırma çalışması

  1. Tez No: 537372
  2. Yazar: ELİF SELEN BABÜROĞLU
  3. Danışmanlar: DOÇ. DR. ALPTEKİN DURMUŞOĞLU, PROF. DR. TÜRKAY DERELİ
  4. Tez Türü: Yüksek Lisans
  5. Konular: Endüstri ve Endüstri Mühendisliği, Industrial and Industrial Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2019
  8. Dil: İngilizce
  9. Üniversite: Gaziantep Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Endüstri Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 114

Özet

Giderek artan oranda“nesnelerin interneti”alanları, sosyal medya uygulamaları, donanım cihazları ve benzeri kaynaklar hayret verici oranda veri üretmektedir. Heterojen kaynaklardan sürekli olarak gelen bu veriye akışkan veri denmektedir. Akışkan veri madenciliği yalnızca aniden popüler olan bir çalışma alanı değil aynı zamanda da karmaşık bir konudur. Akışkan verinin dinamik, sınırsız, yüksek boyutlu ve hızla gelişen yapısından dolayı eski ve geleneksel veri madenciliği teknikleri yetersiz kalmıştır. Gerçek hayatta karşılaşılan; ağ saldırılarının tespit edilmesi, hava tahminleri, istenmeyen e-postaların filtrelenmesi, hırsızlık tespit olayları ve benzeri problemlerde akışkan veriler kullanılmaktadır. Geniş hacimli akışkan verilerde gerçekleştirilen çevrimiçi öğrenme yöntemleri sıklıkla öngörülemeyen bir şekilde kaymaların oluşması ile sonuçlanmaktadır. Bu fenomene içerik kayması denmekte ve bu kaymalar akışkan çalışma veri setinden öğrenilen modeli güvensiz kılmaktadır. İçerik kayması tespit yöntemleri arasında bulunan algılayıcılar, kaymanın oluştuğu yeri ve zamanı tespit ederek sınıflandırma yöntemlerini değiştirerek sınıflandırmanın doğruluğunu yükseltmeye çalışmaktadır. Bu çalışma 13 kavram kayması tespit yöntemi [DDM, EDDM, ADWIN, CUSUM, GMA, PageHinkley, ECDD, HDDMA, HDDMW, SEQDRIFT2, STEPD, RDDM and SEED] ve 8 sınıflandırma yöntemi [NaiveBayes(NB), HoeffdingTree(HT), HoeffdingOption Tree, Perceptron(PR), OzaBagASHT, OzaBagADWIN, Decision Stump(DS), and k-Nearest Neighbor(kNN)] arasında eşleştirmeli bir karşılaştırma yapmaktadır. Analizler yapay veri setleri kullanılarak Massive Online Analysis (MOA) yazılımında gerçekleştirilmiştir.

Özet (Çeviri)

Increasingly, the Internet of Things (IoT) realms, social media applications, hardware devices and etc. generate data at an astonishing rate. These continuously incoming data from heterogeneous sources is referred to as data stream. Data stream mining is not only an urgent trend topic but also entangled. The dynamic, unbounded, high-dimensional and rapidly evolving structure of stream data rendered traditional data mining techniques insufficient. The real-world applications particularly involve real-time streams in an evolving environment; network intrusion detection, weather prediction, spam e-mail filtering, fraud detection, etc. Online learning derives information from the large volume of stream data, usually affected by the changes in the underlying distribution; often in unforeseen ways. This phenomenon, called as concept drift, makes formerly learned models insecure and imprecise in classification manner. As a handling method, concept drift detectors attempt to estimate the position of concept drift in data streams in order to substitute the base learner after drift has occurred and try to improve overall accuracy. This study propose a matched-pair comparison between 13 drift detectors [DDM, EDDM, ADWIN, CUSUM, GMA, PageHinkley, ECDD, HDDMA, HDDMW, SEQDRIFT2, STEPD, RDDM, and SEED] and 8 classifiers as base learners [Naive Bayes(NB), HoeffdingTree(HT), HoeffdingOptionTree, Perceptron(PR), OzaBagASHT, OzaBagADWIN, Decision Stump(DS), and k-Nearest Neighbor(kNN)]. In parallel with the aim of thesis, pairs (classifier, detector) with higher accuracy scores are recommended. The experimental evaluation is conducted on Massive Online Analysis (MOA) software.

Benzer Tezler

  1. Finans alanında veri mahremiyeti yöntemleri: Federe öğrenme ve sentetik veri üretimi

    Data privacy methods in finance: Federated learning and synthetic data generation

    ELİF ÖZCAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2025

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. YUSUF YASLAN

  2. Üç boyutlu yüz tanımada lokal özellik temelli yöntemlerin kullanımı ve karşılaştırılması

    Comparison and usage of local feature based methods for 3d face recognition

    MUHAMMED ENES ATİK

    Yüksek Lisans

    Türkçe

    Türkçe

    2018

    Jeodezi ve Fotogrametriİstanbul Teknik Üniversitesi

    Geomatik Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ZAİDE DURAN

  3. Yük altındaki düz alın dişlilerde farklı profil tepe kesme modifikasyonlarının dişli çalışma frekansına etkisinin incelenmesi ve optimizasyonu

    Investigation and optimization of the effect of different profile tip relief modifications on spur gear mesh frequency under load

    HAKAN YARDIMCI

    Yüksek Lisans

    Türkçe

    Türkçe

    2025

    Makine Mühendisliğiİstanbul Teknik Üniversitesi

    Makine Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ALİ GÖKŞENLİ

    DR. ALİ İMRE AYDENİZ

  4. İntrakraniyal anevrizmaların endovasküler tedavisinde Micrus Cerecyte koyiller ile standart koyillerin karşılaştırılması

    The comparation of bioactive Micrus Cerecyte coils with standart bare platinum coils in endovascular treatmant of intracranial aneurysms

    ÖZGÜR ERTUĞRUL

    Tıpta Uzmanlık

    Türkçe

    Türkçe

    2009

    Radyoloji ve Nükleer TıpHacettepe Üniversitesi

    Radyoloji Ana Bilim Dalı

    PROF. DR. SARUHAN ÇEKİRGE

  5. Superpixel based efficient image representation for segmentation and classification

    Bölütleme ve sınıflandırma için süperpiksel temelli etkin imge simgeleme

    HÜSEYİN EMRAH TAŞLI

    Doktora

    İngilizce

    İngilizce

    2013

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    PROF. DR. ABDULLAH AYDIN ALATAN