Geri Dön

Evolving text stream classification with a novel neural ensemble architecture

Yeni bir sinir topluluğu mimarisi ile gelişen metin akışı sınıflandırması

  1. Tez No: 708875
  2. Yazar: POUYA GHAHRAMANIAN
  3. Danışmanlar: PROF. DR. FAZLI CAN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2022
  8. Dil: İngilizce
  9. Üniversite: İhsan Doğramacı Bilkent Üniversitesi
  10. Enstitü: Mühendislik ve Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 55

Özet

Kavram kayması, girdi verileri ve hedef etiketleri arasındaki ilişkinin zaman içinde değişmesi olarak tanımlanabilir. Bu çalışmada, kavram kayması içeren metin akışlarının anlık sınıflandırılması incelenmektedir. Kavram kayması, zamanla değişen veri varyasyonlarına bağlı olarak modellerin yanlış tahminlerinin artmasına ve performanslarının düşmesine neden olur. Bunu engellemek için kavram kaymasına adapte olabilen modeller geliştirmek gereklidir. Sunduğumuz Uyarlanabilir Sinir Topluluğu Ağı'nı (AdaNEN) modeli, metin akışlarında kavram kaymasına uyum sağlayabilen, topluluk tabanlı yeni bir sinirsel yaklaşım mimarisidir. Özgün AdaNEN mimarisi, çevrimiçi uyarlanabilir öğrenme ortamlarının yarattığı çoğu soruna çözüm üretir. Gelişen metin akışı sınıflandırması problemi, görece az araştırılmıştır. Mevcut çalışmaların çoğu, sayısal akışlarda kavram kayması algılama ve işlemeye yöneliktir. Bunun nedeninin açık ve büyük ölçekli deneysel verilerin eksikliği olduğunu düşünüyoruz. Bu doğrultuda, mevcut literatürdeki bir yaklaşıma dayalı, gerçek dünya metin veri kümelerine çeşitli kavram kaymaları ekleyerek gelişen metin akışları oluşturmaya yönelik, mevcut yeni bir yöntem öneriyoruz. AdaNEN'i teknolojiyi temsil eden 12 referans model ile sekiz veri seti üzerinden karşılaştırılarak yaklaşımımızın kapsamlı bir değerlendirmesini sunuyoruz. Deneysel sonuçlarımız, önerilen yöntemimiz AdaNEN'in, koruyucu verimlilikle tahmine dayalı mevcut yaklaşımlardan tutarlı bir şekilde daha iyi performans gösterdiğini göstermektedir.

Özet (Çeviri)

We study on-the-fly classification of evolving text streams in which the relation between the input data target labels changes over time---i.e. ``concept drift''. These variations decrease the model's performance, as predictions become less accurate over-time and they necessitate a more adaptable system. We introduce Adaptive Neural Ensemble Network (AdaNEN), a novel ensemble-based neural approach, capable of handling concept drift in text streams. With our novel architecture, we address some of the problems neural models face when exploited for online adaptive learning environments. The problem of evolving text stream classification is relatively unexplored and most existing studies address concept drift detection and handling in numerical streams. We hypothesize that the lack of public and large-scale experimental data could be one reason. To this end, we propose a method based on an existing approach for generating evolving text streams by inducing various types of concept drifts to real-world text datasets. We provide an extensive evaluation of our proposed approach using 12 state-of-the-art baselines and eight datasets. Our experimental results show that our proposed method, AdaNEN, consistently outperforms the existing approaches in terms of predictive performance with conservative efficiency.

Benzer Tezler

  1. Websitelerinin kullanılabilirlik değerlendirmesi

    Usability evaluation of websites

    NEVCİHAN TORAMAN

    Doktora

    Türkçe

    Türkçe

    2024

    Endüstri ve Endüstri Mühendisliğiİstanbul Teknik Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ÇİĞDEM ALTIN GÜMÜŞSOY

  2. Global goals, local voices: A multinational comparative sentiment and topic analysis of public transportation in the context of SDGs

    Küresel hedefler, yerel sesler: Sürdürülebilir kalkınma amaçları bağlamında toplu taşımaya yönelik ülkelerin karşılaştırmalı duygu ve konu analizi

    ASLIGÜL AKSAN

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Endüstri ve Endüstri Mühendisliğiİstanbul Teknik Üniversitesi

    İşletme Mühendisliği Ana Bilim Dalı

    PROF. DR. HATİCE CAMGÖZ AKDAĞ

  3. Enhancing Rope data structure for collaborative text editing

    Eş zamanlı metin düzenleme için 'Rope' veri yapısının iyileştirilmesi

    SEMİH SANDAL

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. TOLGA OVATMAN

  4. Irk Bitig'in söz dizimi

    Syntax of Irk Bitig

    YASEMİN DELEN

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    Türk Dili ve EdebiyatıRecep Tayyip Erdoğan Üniversitesi

    Türk Dili ve Edebiyatı Ana Bilim Dalı

    DOÇ. DR. ÜMİT HUNUTLU

  5. İnternet erişimli zaman ayarlı duyuru & reklam panosu tasarımı ve yapımı

    Internet access time adjustment announcement and billboard design and construction

    ENES AÇIKGÖZOĞLU

    Yüksek Lisans

    Türkçe

    Türkçe

    2013

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSüleyman Demirel Üniversitesi

    Elektronik-Bilgisayar Eğitimi Ana Bilim Dalı

    DOÇ. DR. ABDÜLKADİR ÇAKIR