Efficient classification of multi-label data streams with label prioritization
Çok-etiketli veri akışlarının etiket önceliklendirmesi ile verimli sınıflandırılması
- Tez No: 955360
- Danışmanlar: PROF. DR. FAZLI CAN
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2025
- Dil: İngilizce
- Üniversite: İhsan Doğramacı Bilkent Üniversitesi
- Enstitü: Mühendislik ve Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Mühendislik Bilimleri Ana Bilim Dalı
- Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
- Sayfa Sayısı: 45
Özet
Gerçek zamanlı veri işleme sistemleri, hızla sınıflandırılması gereken büyük miktarda veri üretir. Bu veri akışları; hacim, çeşitlilik, hız ve belirsizlik gibi özellikler taşıdığından, geleneksel sınıflandırma yöntemlerinin yetersiz kaldığı durumlar ortaya çıkmaktadır. Ayrıca, gelen veriler aynı anda birden fazla sınıfa ait olabilir. Ancak, etiket sayısı arttıkça, mevcut çok etiketli veri akışı sınıflandırma yöntemlerinin çoğu hesaplama açısından verimsiz olmaktadır. Bu çalışmada, Öncelikli İkili Dönüşüm (Prioritized Binary Transformation – PBT) adını verdiğimiz yeni bir çevrimiçi sınıflandırma yöntemi öneriyoruz. Bu yöntem, çok sayıda etiketi daha verimli şekilde işleyebilmek için etiketleri önem derecelerine göre yeniden sıralar. Bu sıralama, sabit boyuttaki bir pencere üzerinden uygulanan Temel Bileşenler Analizi (Principal Component Analysis, PCA) ile elde edilir. Yeniden sıralanan etiketler, daha etkili bir sınıflandırma için veri üzerinde dönüşüm yapılmasını sağlar. Bu çalışmada önerdiğimiz yöntemi, 12 farklı veri kümesi üzerinde; dört yaygın karşılaştırma yöntemi ve dört farklı değerlendirme ölçütü kullanarak karşılaştırdık. PBT, bu ölçütlerin üçünde ortalama olarak en iyi sıralamayı elde etmektedir. Ayrıca her bir yöntemin işlem süresi ve bellek kullanımı açısından verimliliği ölçüldüğünde PBT sırasıyla ikinci en hızlı ve en az bellek kullanan yöntem olarak gözlenmiştir.
Özet (Çeviri)
Real-time data processing systems generate huge amounts of data that need to be classified. The volume, variety, velocity, and veracity (uncertainty) of this data necessitate new approaches and the adaptation of existing classification methods. Moreover, the arriving data can belong to more than one class at the same time. As the number of labels grows larger, a significant portion of the multi-label data stream classification methods become computationally inefficient. We propose a novel online approach: the Prioritized Binary Transformation (PBT) method, which can classify data with large numbers of labels by ordering the labels using Principal Component Analysis (PCA) within a fixed-size window. This order is then used to transform the label vectors for classification. We perform an empirical analysis on 12 datasets and compare PBT to four prominent baselines using four evaluation metrics. PBT achieves the best average ranking in three of the four evaluation metrics. Moreover, we investigate efficiency under average execution time per data item and memory consumption where PBT achieves second and first average rankings, respectively.
Benzer Tezler
- Audio visual attention for robots from a developmental perspective
Gelişimsel perspektiften robotlar için görsel ve işitsel diıkkat
NADA AL AZZAWI
Yüksek Lisans
İngilizce
2018
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. GÖKHAN İNCE
- Robust and efficient density based outlier detection methods for streaming data
Akış verileri için gürbüz ve verimli yoğunluk tabanlı aykırı değer tespit yöntemleri
ALİ DEĞİRMENCİ
Doktora
İngilizce
2022
Elektrik ve Elektronik MühendisliğiAnkara Yıldırım Beyazıt ÜniversitesiElektrik ve Elektronik Mühendisliği Ana Bilim Dalı
DOÇ. DR. ÖMER KARAL
- Elektrikli araçların kullanıcı tercihlerine göre sınıflandırılması: hibrit bir yaklaşım
Classification of electric vehicles based on user preference: a hybrid approach
MEHMET DEMİR
Yüksek Lisans
Türkçe
2025
Endüstri ve Endüstri Mühendisliğiİstanbul Teknik ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
DOÇ. DR. UMUT ASAN
- Görüntü sınıflandırması için yapay sinir ağlarının analiz ve optimizasyonu
Analysis and optimization of artificial neural networks for image classification
OZAN ARSLAN
Doktora
Türkçe
2001
Jeodezi ve Fotogrametriİstanbul Teknik ÜniversitesiPROF. DR. OĞUZ MÜFTÜOĞLU
PROF. DR. CANKUT ÖRMECİ
- Derin öğrenme ile sosyal ağlarda radyolojik görüntü ve metin tabanlı medikal kavram tespiti
Radiological image and text based medical concept detection in social networks with deep learning
SÜMEYYE BAYRAKDAR
Doktora
Türkçe
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolDüzce ÜniversitesiElektrik-Elektronik ve Bilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. İBRAHİM YÜCEDAĞ