Geri Dön

Comparison of active learning based hierarchical classification approaches on twitter

Twitter alanında hiyerarşik sınıflandırma yöntemini temel alan aktif öğrenmenin karşılaştırılması

  1. Tez No: 418650
  2. Yazar: RASHİD ZAMAN
  3. Danışmanlar: PROF. DR. YÜCEL SAYGIN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2015
  8. Dil: İngilizce
  9. Üniversite: Sabancı Üniversitesi
  10. Enstitü: Mühendislik ve Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 56

Özet

Gerçek hayatta veriler sıklıkla çok etiketlidir, yani aynı anda birden fazla sınıfa ya da kategoriye ait olabilirler. Bazen bu sınıflar üst seviyeler genel, alt seviyeler ise daha özel olacak şekilde mantıksal bir hiyerarşi oluşturur. Makine öğrenmesi kapsamında geliştirilmiş olan çoğu sınıflandırma yöntemi ya tek etiketli sınıflandırma yapar ya da çok etiketli sınıflandırma yapacak şekilde değiştirilir.Hiyerarşik sınıflandırma yapmak için uygun sınıflandırma yöntemleri henüz bulunmamaktadır ancak bunun için tek etiketli sınıflandırmayı baz alan stratejiler geliştirilmiştir. Bu stratejilerden dördü literatürde iyi bilinmektedir. Hiyerarşik sınıflandırma metin ketogorizasyonu, web sayfası sınıflandırması, medikal tanı gibi alanlarda çalışılmış ve etkinliği gösterilmiştir. Ancak şu ana kadar Twitter'a özel hiyerarşik sınıflandırma üzerine çalışılmamıştır. Bunun yanında, gözetimli öğrenme yöntemleri için etiketli verilere ihtiyaç duyulur ve etiketleme için insan gücü, zaman, ve maddi kaynak gerekir. Bu da etiketlenen verilerin sınırlı olmasına sebep olur ve aktif öğrenme bu anlamda daha az verinin etiketlenmesi ile düzgün modeller oluşturulmasını sağlar. Aktif Öğrenmede, en fazla bilgi içeren etiketlenmemiş veri seçilir ve uzmanlara etiketlemesi için sunulur. Bu sayede gözetimli öğrenmeye yakın bir performansla daha az etiketli veri kullanılarak model oluşturulması sağlanır. Aktif öğrenme, etiketlenmemiş verilerin çok olduğu durumlar için uygundur. Tweetlerin hiyerarşik sınıflandırmasının aktif öğrenme ile gerçekleştirilmesi de bu bakımdan anlamlı bir araştırma alandır. Bu tezde, önde gelen 4 hiyerarşik sınıflandırma yaklaşımını uyguladık ve aktif öğrenme için bunları Twitter ortamına uyarladık. Elde ettiğimiz sonuçlar baz alındığında, aktif öğrenmenin Twitter alanında faydalı olduğunu görmekteyiz. Uyguladığımız dört ana yaklaşımı karşılaştırdığımızda düz sınıflandırmalı hiyerarşik kestirim kullanılarak yapılan aktif öğrenmenin diğer üç yöntemden daha iyi sonuçlar verdiğini gördük.

Özet (Çeviri)

Real world data is mostly multi-labeled i.e., it belongs to multiple classes simultaneously, as opposed to single labeled data belonging to a single class. At times these multiple labels fit into a logical hierarchy such that parent labels up in the hierarchy are generic and the related child labels down the hierarchy are more specific. Most of the machine learning classifiers are either serving single label classification tasks or have been transformed to perform flat multi-label classification. At present, dedicated classifiers for hierarchical classification do not exist. For the purpose, strategies are designed relying on the single labeled classifiers to perform hierarchical classification. Four such strategies are well-known in literature. Hierarchical classification has been researched in many domains like text categorization, webpages classification, medical diagnosis and has been found very useful. So far Twitter has been neglected by the researchers in hierarchical classification perspective. For developing supervised models labeled data is needed and labeling task requires resources in terms of humans, money and time, delimiting the amount of data which can be labeled. Active learning, a type of supervised learning, achieves acceptable performance with minimal amount of labeled data as compared to supervised learning models. In active learning, the learner selects the most informative unlabeled instances and are labeled by the experts. This makes possible to achieve comparable model performance to that of supervised learning with lesser labeling effort and resources. Active learning is well-suited to the situations where unlabeled data is abundantly available. Hierarchical classification of tweets complemented by active learning as a viable labeling mechanism presents an interesting research problem. We implemented the prevailing four hierarchical classification approaches with active learning for twitter domain. Based on the results, we can safely say that active learning is equally beneficial in Twitter. Comparing the results of the four approaches, hierarchical prediction through flat classification with active learning approach outperforms the other approaches.

Benzer Tezler

  1. Derin öğrenme yöntemi ile optik uydu görüntülerinden gemi tespiti

    Ship detection by optical satellite images with deep learning method

    OSMAN DUMAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    İletişim Sistemleri Ana Bilim Dalı

    PROF. DR. MESUT KARTAL

  2. 'Hücre ve bölünmeler' ve 'Kuvvet ve enerji' ünitelerinin öğretiminde farklı aktif öğrenme yöntemlerinin etkililiklerinin karşılaştırılması

    Comparison of the effects of different active learning methods on the teaching of 'Cell and divisions' and 'Force and energy' units

    ULUHAN KURT

    Doktora

    Türkçe

    Türkçe

    2020

    Eğitim ve ÖğretimAtatürk Üniversitesi

    Matematik ve Fen Bilimleri Eğitimi Ana Bilim Dalı

    PROF. DR. FATİH SEZEK

  3. Etkin öğrenmenin yabancı dil benlik algısı ve İngilizce okuduğunu anlama başarısı üzerindeki etkililiği

    The effects of active learning on foreign language self concept and reading comprehension achievement

    MUSTAFA ER

    Doktora

    Türkçe

    Türkçe

    2007

    Eğitim ve ÖğretimDokuz Eylül Üniversitesi

    Eğitim Bilimleri Ana Bilim Dalı

    Y.DOÇ. UĞUR ALTUNAY

  4. Active learning based human in the loop deep object detectionfor scalable data annotation

    Ölçeklenebilir veri etiketlenmesi için aktif öğrenme tabanlı insan katılımlı derin nesne tespiti sistemi

    ATABERK ARMAN KAYHAN

    Yüksek Lisans

    İngilizce

    İngilizce

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Uçak ve Uzay Mühendisliği Ana Bilim Dalı

    DOÇ. DR. NAZIM KEMAL ÜRE

  5. Türkiye ve İngiltere ilköğretim anadili öğretim programlarının karşılaştırılması

    Comparison of mother tongue curriculum in Turkey and England primary school

    CELALETTİN ÇELEBİ

    Doktora

    Türkçe

    Türkçe

    2012

    Eğitim ve ÖğretimNecmettin Erbakan Üniversitesi

    Eğitim Bilimleri Ana Bilim Dalı

    PROF. DR. ALİ MURAT SÜNBÜL