Geri Dön

K-boyutlu ağaç, uyarlanabilir yarıçap ve öznitelik seçme (KD-ARFS stream) tabanlı gerçek zamanlı akan veri kümeleme

KD-tree, adaptive radius and feature selection (KD-ARFS stream) based real time data stream clustering

  1. Tez No: 564761
  2. Yazar: ALİ ŞENOL
  3. Danışmanlar: DOÇ. DR. HACER KARACAN
  4. Tez Türü: Doktora
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2019
  8. Dil: Türkçe
  9. Üniversite: Gazi Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 181

Özet

Klasik kümeleme yaklaşımlarında veri statiktir. Veri, bir yere kaydedilerek tekrar tekrar işlenebilmektedir. Oysa günümüz teknolojisinde, verinin çok hızlı olduğu dünyada, artık veriyi akarken kümeleyecek, kullanıcıya istediği zaman sonuç verebilecek uygulamalara ihtiyaç vardır. Bu anlamda ihtiyacı karşılayan akan veri kümeleme yaklaşımlarına olan talep gün geçtikçe artmaktadır. Çünkü akan veri kümeleme yaklaşımları veriyi bir defa okumalı, hızlı ve kendisini yeni gelen veriye uyarlama özelliğine sahiptir. Yani bir yandan veri akarken, bir yandan kullanıcıya sonuç üretilebilmektedir. Bu tez çalışmasında akan veri üzerinde gerçek zamanlı kümeleme yapan KD-ARFS Stream algoritması önerilmiştir. Önerdiğimiz yaklaşım gücünü çok boyutluluğu destekleyen k-boyutlu ağaç (kd-tree), uyarlanabilir yarıçap ve standart sapma tabanlı öznitelik seçme özelliklerinden almaktadır. KD-ARFS Stream algoritmasının başarısını ölçmek için SE-Stream, CEDAS, pcStream ve DPStream algoritmaları ile toplam harcanan süre ve kümeleme başarısı açılarından karşılaştırılmıştır. Deneysel çalışmalar KD-ARFS Stream algoritmasının daha iyi kümeleme başarısını makul bir sürede verdiğini göstermiştir.

Özet (Çeviri)

In classical data clustering approaches, data is static. It is possible to store the data and process it again and again. However, in the today's technology, in which the data is very fast, it is needed to process the data while it is being streamed and results should be shown to the user whenever the user want. In this sense, demand for data stream clustering approaches, which meet the needs, is increasing day by day. Because data stream clustering approaches are fast, have once read ability and can adapt themselves to new data. In other words, while data is streaming on the other hand, results can be shown to the user on the one hand. In this thesis, KD-ARFS Stream algorithm, which clusters streaming data in real-time is proposed. The proposed approach takes its power from kd-tree, which supports multidimensionality, standard deviation based feature selection and adaptive radius. In order to present the success of KD-ARFS Stream algorithm, it is compared with SE-Stream, pcStream, CEDAS and DPStream algorithms in aspects of consumed time and clustering quality. Experimental results have shown that the KD-ARFS Stream algorithm provides better clustering quality in a reasonable time.

Benzer Tezler

  1. Fake news classification using machine learning and deep learning approaches

    Makine öğrenimi ve derin öğrenme yaklaşımlarını kullanarak sahte haber sınıflandırması

    SAJA ABDULHALEEM MAHMOOD AL-OBAIDI

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ TUBA ÇAĞLIKANTAR

  2. Zaman serisi sınıflandırması için dalgacık dönüşümüne dayalı yeni bir yaklaşım

    A novel approach for time series classification based on wavelet decomposition

    ARZU FİDAN

    Doktora

    Türkçe

    Türkçe

    2024

    İstatistikMuğla Sıtkı Koçman Üniversitesi

    İstatistik Ana Bilim Dalı

    DOÇ. DR. NEVİN GÜLER DİNCER

  3. Gerçek zamanlı akan veri probleminde ağaç veri yapısı ve mikro kümeler ile düzensiz kümeler oluşturmak

    Defining irregular clusters by using tree data structure and microclusters in real time streaming data problem

    BERFİN ERDİNÇ

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSiirt Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ MAHMUT KAYA

    DR. ÖĞR. ÜYESİ ALİ ŞENOL

  4. A survey on known algorithms in solving generalization birthday problem (K-list)

    Genel do‡ğum günü probleminin (K-liste) çözen bilinen algoritmalar üzerine bir araştırma

    MİNA NAMAZİESFANJANİ

    Yüksek Lisans

    İngilizce

    İngilizce

    2013

    MatematikOrta Doğu Teknik Üniversitesi

    Kriptografi Ana Bilim Dalı

    PROF. DR. FERRUH ÖZBUDAK

  5. Mikro boyutlu örneklerde meşe odununun bazı mekanik özellikleri üzerine rutubetin etkisinin belirlenmesi ve standart boyutlu örneklerle karşılaştırılması

    Determination of the effect of moisture content on some mechanical properties of micro-size oak wood and comparison with standard size samples

    OGÜN KORKMAZ

    Yüksek Lisans

    Türkçe

    Türkçe

    2018

    Ormancılık ve Orman MühendisliğiDüzce Üniversitesi

    Orman Endüstri Mühendisliği Ana Bilim Dalı

    PROF. DR. ÜMİT BÜYÜKSARI