Evolving text stream classification with a novel neural ensemble architecture
Yeni bir sinir topluluğu mimarisi ile gelişen metin akışı sınıflandırması
- Tez No: 708875
- Danışmanlar: PROF. DR. FAZLI CAN
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2022
- Dil: İngilizce
- Üniversite: İhsan Doğramacı Bilkent Üniversitesi
- Enstitü: Mühendislik ve Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 55
Özet
Kavram kayması, girdi verileri ve hedef etiketleri arasındaki ilişkinin zaman içinde değişmesi olarak tanımlanabilir. Bu çalışmada, kavram kayması içeren metin akışlarının anlık sınıflandırılması incelenmektedir. Kavram kayması, zamanla değişen veri varyasyonlarına bağlı olarak modellerin yanlış tahminlerinin artmasına ve performanslarının düşmesine neden olur. Bunu engellemek için kavram kaymasına adapte olabilen modeller geliştirmek gereklidir. Sunduğumuz Uyarlanabilir Sinir Topluluğu Ağı'nı (AdaNEN) modeli, metin akışlarında kavram kaymasına uyum sağlayabilen, topluluk tabanlı yeni bir sinirsel yaklaşım mimarisidir. Özgün AdaNEN mimarisi, çevrimiçi uyarlanabilir öğrenme ortamlarının yarattığı çoğu soruna çözüm üretir. Gelişen metin akışı sınıflandırması problemi, görece az araştırılmıştır. Mevcut çalışmaların çoğu, sayısal akışlarda kavram kayması algılama ve işlemeye yöneliktir. Bunun nedeninin açık ve büyük ölçekli deneysel verilerin eksikliği olduğunu düşünüyoruz. Bu doğrultuda, mevcut literatürdeki bir yaklaşıma dayalı, gerçek dünya metin veri kümelerine çeşitli kavram kaymaları ekleyerek gelişen metin akışları oluşturmaya yönelik, mevcut yeni bir yöntem öneriyoruz. AdaNEN'i teknolojiyi temsil eden 12 referans model ile sekiz veri seti üzerinden karşılaştırılarak yaklaşımımızın kapsamlı bir değerlendirmesini sunuyoruz. Deneysel sonuçlarımız, önerilen yöntemimiz AdaNEN'in, koruyucu verimlilikle tahmine dayalı mevcut yaklaşımlardan tutarlı bir şekilde daha iyi performans gösterdiğini göstermektedir.
Özet (Çeviri)
We study on-the-fly classification of evolving text streams in which the relation between the input data target labels changes over time---i.e. ``concept drift''. These variations decrease the model's performance, as predictions become less accurate over-time and they necessitate a more adaptable system. We introduce Adaptive Neural Ensemble Network (AdaNEN), a novel ensemble-based neural approach, capable of handling concept drift in text streams. With our novel architecture, we address some of the problems neural models face when exploited for online adaptive learning environments. The problem of evolving text stream classification is relatively unexplored and most existing studies address concept drift detection and handling in numerical streams. We hypothesize that the lack of public and large-scale experimental data could be one reason. To this end, we propose a method based on an existing approach for generating evolving text streams by inducing various types of concept drifts to real-world text datasets. We provide an extensive evaluation of our proposed approach using 12 state-of-the-art baselines and eight datasets. Our experimental results show that our proposed method, AdaNEN, consistently outperforms the existing approaches in terms of predictive performance with conservative efficiency.
Benzer Tezler
- Websitelerinin kullanılabilirlik değerlendirmesi
Usability evaluation of websites
NEVCİHAN TORAMAN
Doktora
Türkçe
2024
Endüstri ve Endüstri Mühendisliğiİstanbul Teknik ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
DOÇ. DR. ÇİĞDEM ALTIN GÜMÜŞSOY
- Global goals, local voices: A multinational comparative sentiment and topic analysis of public transportation in the context of SDGs
Küresel hedefler, yerel sesler: Sürdürülebilir kalkınma amaçları bağlamında toplu taşımaya yönelik ülkelerin karşılaştırmalı duygu ve konu analizi
ASLIGÜL AKSAN
Yüksek Lisans
İngilizce
2024
Endüstri ve Endüstri Mühendisliğiİstanbul Teknik Üniversitesiİşletme Mühendisliği Ana Bilim Dalı
PROF. DR. HATİCE CAMGÖZ AKDAĞ
- Enhancing Rope data structure for collaborative text editing
Eş zamanlı metin düzenleme için 'Rope' veri yapısının iyileştirilmesi
SEMİH SANDAL
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. TOLGA OVATMAN
- Irk Bitig'in söz dizimi
Syntax of Irk Bitig
YASEMİN DELEN
Yüksek Lisans
Türkçe
2024
Türk Dili ve EdebiyatıRecep Tayyip Erdoğan ÜniversitesiTürk Dili ve Edebiyatı Ana Bilim Dalı
DOÇ. DR. ÜMİT HUNUTLU
- İnternet erişimli zaman ayarlı duyuru & reklam panosu tasarımı ve yapımı
Internet access time adjustment announcement and billboard design and construction
ENES AÇIKGÖZOĞLU
Yüksek Lisans
Türkçe
2013
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSüleyman Demirel ÜniversitesiElektronik-Bilgisayar Eğitimi Ana Bilim Dalı
DOÇ. DR. ABDÜLKADİR ÇAKIR