A matched-pair comparative study on classification of data streams with concept drift
İçerik kayması bulunan akışkan verilerin sınıflandırılmasında eşleştirmeli karşılaştırma çalışması
- Tez No: 537372
- Danışmanlar: DOÇ. DR. ALPTEKİN DURMUŞOĞLU, PROF. DR. TÜRKAY DERELİ
- Tez Türü: Yüksek Lisans
- Konular: Endüstri ve Endüstri Mühendisliği, Industrial and Industrial Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2019
- Dil: İngilizce
- Üniversite: Gaziantep Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Endüstri Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 114
Özet
Giderek artan oranda“nesnelerin interneti”alanları, sosyal medya uygulamaları, donanım cihazları ve benzeri kaynaklar hayret verici oranda veri üretmektedir. Heterojen kaynaklardan sürekli olarak gelen bu veriye akışkan veri denmektedir. Akışkan veri madenciliği yalnızca aniden popüler olan bir çalışma alanı değil aynı zamanda da karmaşık bir konudur. Akışkan verinin dinamik, sınırsız, yüksek boyutlu ve hızla gelişen yapısından dolayı eski ve geleneksel veri madenciliği teknikleri yetersiz kalmıştır. Gerçek hayatta karşılaşılan; ağ saldırılarının tespit edilmesi, hava tahminleri, istenmeyen e-postaların filtrelenmesi, hırsızlık tespit olayları ve benzeri problemlerde akışkan veriler kullanılmaktadır. Geniş hacimli akışkan verilerde gerçekleştirilen çevrimiçi öğrenme yöntemleri sıklıkla öngörülemeyen bir şekilde kaymaların oluşması ile sonuçlanmaktadır. Bu fenomene içerik kayması denmekte ve bu kaymalar akışkan çalışma veri setinden öğrenilen modeli güvensiz kılmaktadır. İçerik kayması tespit yöntemleri arasında bulunan algılayıcılar, kaymanın oluştuğu yeri ve zamanı tespit ederek sınıflandırma yöntemlerini değiştirerek sınıflandırmanın doğruluğunu yükseltmeye çalışmaktadır. Bu çalışma 13 kavram kayması tespit yöntemi [DDM, EDDM, ADWIN, CUSUM, GMA, PageHinkley, ECDD, HDDMA, HDDMW, SEQDRIFT2, STEPD, RDDM and SEED] ve 8 sınıflandırma yöntemi [NaiveBayes(NB), HoeffdingTree(HT), HoeffdingOption Tree, Perceptron(PR), OzaBagASHT, OzaBagADWIN, Decision Stump(DS), and k-Nearest Neighbor(kNN)] arasında eşleştirmeli bir karşılaştırma yapmaktadır. Analizler yapay veri setleri kullanılarak Massive Online Analysis (MOA) yazılımında gerçekleştirilmiştir.
Özet (Çeviri)
Increasingly, the Internet of Things (IoT) realms, social media applications, hardware devices and etc. generate data at an astonishing rate. These continuously incoming data from heterogeneous sources is referred to as data stream. Data stream mining is not only an urgent trend topic but also entangled. The dynamic, unbounded, high-dimensional and rapidly evolving structure of stream data rendered traditional data mining techniques insufficient. The real-world applications particularly involve real-time streams in an evolving environment; network intrusion detection, weather prediction, spam e-mail filtering, fraud detection, etc. Online learning derives information from the large volume of stream data, usually affected by the changes in the underlying distribution; often in unforeseen ways. This phenomenon, called as concept drift, makes formerly learned models insecure and imprecise in classification manner. As a handling method, concept drift detectors attempt to estimate the position of concept drift in data streams in order to substitute the base learner after drift has occurred and try to improve overall accuracy. This study propose a matched-pair comparison between 13 drift detectors [DDM, EDDM, ADWIN, CUSUM, GMA, PageHinkley, ECDD, HDDMA, HDDMW, SEQDRIFT2, STEPD, RDDM, and SEED] and 8 classifiers as base learners [Naive Bayes(NB), HoeffdingTree(HT), HoeffdingOptionTree, Perceptron(PR), OzaBagASHT, OzaBagADWIN, Decision Stump(DS), and k-Nearest Neighbor(kNN)]. In parallel with the aim of thesis, pairs (classifier, detector) with higher accuracy scores are recommended. The experimental evaluation is conducted on Massive Online Analysis (MOA) software.
Benzer Tezler
- Üç boyutlu yüz tanımada lokal özellik temelli yöntemlerin kullanımı ve karşılaştırılması
Comparison and usage of local feature based methods for 3d face recognition
MUHAMMED ENES ATİK
Yüksek Lisans
Türkçe
2018
Jeodezi ve Fotogrametriİstanbul Teknik ÜniversitesiGeomatik Mühendisliği Ana Bilim Dalı
DOÇ. DR. ZAİDE DURAN
- İntrakraniyal anevrizmaların endovasküler tedavisinde Micrus Cerecyte koyiller ile standart koyillerin karşılaştırılması
The comparation of bioactive Micrus Cerecyte coils with standart bare platinum coils in endovascular treatmant of intracranial aneurysms
ÖZGÜR ERTUĞRUL
Tıpta Uzmanlık
Türkçe
2009
Radyoloji ve Nükleer TıpHacettepe ÜniversitesiRadyoloji Ana Bilim Dalı
PROF. DR. SARUHAN ÇEKİRGE
- Superpixel based efficient image representation for segmentation and classification
Bölütleme ve sınıflandırma için süperpiksel temelli etkin imge simgeleme
HÜSEYİN EMRAH TAŞLI
Doktora
İngilizce
2013
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
PROF. DR. ABDULLAH AYDIN ALATAN
- Böbrek taşı tedavisinde prone ve supin mini perkütan nefrolitotomi yöntemlerinin etkinlik, güvenilirliğinin karşılaştırılması: 1:1 eşleştirmeli analiz
Comparison of the efficacy and safety of mini percutaneous nephrolithotomy in renal stone treatment under the prone and supine position: a matched-pair analysis
HARUN ÖZDEMİR
Tıpta Uzmanlık
Türkçe
2018
ÜrolojiSağlık Bilimleri ÜniversitesiÜroloji Ana Bilim Dalı
DOÇ. DR. MEHMET FATİH AKBULUT
UZMAN AKİF ERBİN