Geri Dön

Efficient classification of multi-label data streams with label prioritization

Çok-etiketli veri akışlarının etiket önceliklendirmesi ile verimli sınıflandırılması

  1. Tez No: 955360
  2. Yazar: ONUR YILDIRIM
  3. Danışmanlar: PROF. DR. FAZLI CAN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2025
  8. Dil: İngilizce
  9. Üniversite: İhsan Doğramacı Bilkent Üniversitesi
  10. Enstitü: Mühendislik ve Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Mühendislik Bilimleri Ana Bilim Dalı
  12. Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
  13. Sayfa Sayısı: 45

Özet

Gerçek zamanlı veri işleme sistemleri, hızla sınıflandırılması gereken büyük miktarda veri üretir. Bu veri akışları; hacim, çeşitlilik, hız ve belirsizlik gibi özellikler taşıdığından, geleneksel sınıflandırma yöntemlerinin yetersiz kaldığı durumlar ortaya çıkmaktadır. Ayrıca, gelen veriler aynı anda birden fazla sınıfa ait olabilir. Ancak, etiket sayısı arttıkça, mevcut çok etiketli veri akışı sınıflandırma yöntemlerinin çoğu hesaplama açısından verimsiz olmaktadır. Bu çalışmada, Öncelikli İkili Dönüşüm (Prioritized Binary Transformation – PBT) adını verdiğimiz yeni bir çevrimiçi sınıflandırma yöntemi öneriyoruz. Bu yöntem, çok sayıda etiketi daha verimli şekilde işleyebilmek için etiketleri önem derecelerine göre yeniden sıralar. Bu sıralama, sabit boyuttaki bir pencere üzerinden uygulanan Temel Bileşenler Analizi (Principal Component Analysis, PCA) ile elde edilir. Yeniden sıralanan etiketler, daha etkili bir sınıflandırma için veri üzerinde dönüşüm yapılmasını sağlar. Bu çalışmada önerdiğimiz yöntemi, 12 farklı veri kümesi üzerinde; dört yaygın karşılaştırma yöntemi ve dört farklı değerlendirme ölçütü kullanarak karşılaştırdık. PBT, bu ölçütlerin üçünde ortalama olarak en iyi sıralamayı elde etmektedir. Ayrıca her bir yöntemin işlem süresi ve bellek kullanımı açısından verimliliği ölçüldüğünde PBT sırasıyla ikinci en hızlı ve en az bellek kullanan yöntem olarak gözlenmiştir.

Özet (Çeviri)

Real-time data processing systems generate huge amounts of data that need to be classified. The volume, variety, velocity, and veracity (uncertainty) of this data necessitate new approaches and the adaptation of existing classification methods. Moreover, the arriving data can belong to more than one class at the same time. As the number of labels grows larger, a significant portion of the multi-label data stream classification methods become computationally inefficient. We propose a novel online approach: the Prioritized Binary Transformation (PBT) method, which can classify data with large numbers of labels by ordering the labels using Principal Component Analysis (PCA) within a fixed-size window. This order is then used to transform the label vectors for classification. We perform an empirical analysis on 12 datasets and compare PBT to four prominent baselines using four evaluation metrics. PBT achieves the best average ranking in three of the four evaluation metrics. Moreover, we investigate efficiency under average execution time per data item and memory consumption where PBT achieves second and first average rankings, respectively.

Benzer Tezler

  1. Audio visual attention for robots from a developmental perspective

    Gelişimsel perspektiften robotlar için görsel ve işitsel diıkkat

    NADA AL AZZAWI

    Yüksek Lisans

    İngilizce

    İngilizce

    2018

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. GÖKHAN İNCE

  2. Robust and efficient density based outlier detection methods for streaming data

    Akış verileri için gürbüz ve verimli yoğunluk tabanlı aykırı değer tespit yöntemleri

    ALİ DEĞİRMENCİ

    Doktora

    İngilizce

    İngilizce

    2022

    Elektrik ve Elektronik MühendisliğiAnkara Yıldırım Beyazıt Üniversitesi

    Elektrik ve Elektronik Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ÖMER KARAL

  3. Elektrikli araçların kullanıcı tercihlerine göre sınıflandırılması: hibrit bir yaklaşım

    Classification of electric vehicles based on user preference: a hybrid approach

    MEHMET DEMİR

    Yüksek Lisans

    Türkçe

    Türkçe

    2025

    Endüstri ve Endüstri Mühendisliğiİstanbul Teknik Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    DOÇ. DR. UMUT ASAN

  4. Görüntü sınıflandırması için yapay sinir ağlarının analiz ve optimizasyonu

    Analysis and optimization of artificial neural networks for image classification

    OZAN ARSLAN

    Doktora

    Türkçe

    Türkçe

    2001

    Jeodezi ve Fotogrametriİstanbul Teknik Üniversitesi

    PROF. DR. OĞUZ MÜFTÜOĞLU

    PROF. DR. CANKUT ÖRMECİ

  5. Derin öğrenme ile sosyal ağlarda radyolojik görüntü ve metin tabanlı medikal kavram tespiti

    Radiological image and text based medical concept detection in social networks with deep learning

    SÜMEYYE BAYRAKDAR

    Doktora

    Türkçe

    Türkçe

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolDüzce Üniversitesi

    Elektrik-Elektronik ve Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. İBRAHİM YÜCEDAĞ