Geri Dön

Comparison of active learning based hierarchical classification approaches on twitter

Twitter alanında hiyerarşik sınıflandırma yöntemini temel alan aktif öğrenmenin karşılaştırılması

  1. Tez No: 418650
  2. Yazar: RASHİD ZAMAN
  3. Danışmanlar: PROF. DR. YÜCEL SAYGIN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2015
  8. Dil: İngilizce
  9. Üniversite: Sabancı Üniversitesi
  10. Enstitü: Mühendislik ve Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 56

Özet

Gerçek hayatta veriler sıklıkla çok etiketlidir, yani aynı anda birden fazla sınıfa ya da kategoriye ait olabilirler. Bazen bu sınıflar üst seviyeler genel, alt seviyeler ise daha özel olacak şekilde mantıksal bir hiyerarşi oluşturur. Makine öğrenmesi kapsamında geliştirilmiş olan çoğu sınıflandırma yöntemi ya tek etiketli sınıflandırma yapar ya da çok etiketli sınıflandırma yapacak şekilde değiştirilir.Hiyerarşik sınıflandırma yapmak için uygun sınıflandırma yöntemleri henüz bulunmamaktadır ancak bunun için tek etiketli sınıflandırmayı baz alan stratejiler geliştirilmiştir. Bu stratejilerden dördü literatürde iyi bilinmektedir. Hiyerarşik sınıflandırma metin ketogorizasyonu, web sayfası sınıflandırması, medikal tanı gibi alanlarda çalışılmış ve etkinliği gösterilmiştir. Ancak şu ana kadar Twitter'a özel hiyerarşik sınıflandırma üzerine çalışılmamıştır. Bunun yanında, gözetimli öğrenme yöntemleri için etiketli verilere ihtiyaç duyulur ve etiketleme için insan gücü, zaman, ve maddi kaynak gerekir. Bu da etiketlenen verilerin sınırlı olmasına sebep olur ve aktif öğrenme bu anlamda daha az verinin etiketlenmesi ile düzgün modeller oluşturulmasını sağlar. Aktif Öğrenmede, en fazla bilgi içeren etiketlenmemiş veri seçilir ve uzmanlara etiketlemesi için sunulur. Bu sayede gözetimli öğrenmeye yakın bir performansla daha az etiketli veri kullanılarak model oluşturulması sağlanır. Aktif öğrenme, etiketlenmemiş verilerin çok olduğu durumlar için uygundur. Tweetlerin hiyerarşik sınıflandırmasının aktif öğrenme ile gerçekleştirilmesi de bu bakımdan anlamlı bir araştırma alandır. Bu tezde, önde gelen 4 hiyerarşik sınıflandırma yaklaşımını uyguladık ve aktif öğrenme için bunları Twitter ortamına uyarladık. Elde ettiğimiz sonuçlar baz alındığında, aktif öğrenmenin Twitter alanında faydalı olduğunu görmekteyiz. Uyguladığımız dört ana yaklaşımı karşılaştırdığımızda düz sınıflandırmalı hiyerarşik kestirim kullanılarak yapılan aktif öğrenmenin diğer üç yöntemden daha iyi sonuçlar verdiğini gördük.

Özet (Çeviri)

Real world data is mostly multi-labeled i.e., it belongs to multiple classes simultaneously, as opposed to single labeled data belonging to a single class. At times these multiple labels fit into a logical hierarchy such that parent labels up in the hierarchy are generic and the related child labels down the hierarchy are more specific. Most of the machine learning classifiers are either serving single label classification tasks or have been transformed to perform flat multi-label classification. At present, dedicated classifiers for hierarchical classification do not exist. For the purpose, strategies are designed relying on the single labeled classifiers to perform hierarchical classification. Four such strategies are well-known in literature. Hierarchical classification has been researched in many domains like text categorization, webpages classification, medical diagnosis and has been found very useful. So far Twitter has been neglected by the researchers in hierarchical classification perspective. For developing supervised models labeled data is needed and labeling task requires resources in terms of humans, money and time, delimiting the amount of data which can be labeled. Active learning, a type of supervised learning, achieves acceptable performance with minimal amount of labeled data as compared to supervised learning models. In active learning, the learner selects the most informative unlabeled instances and are labeled by the experts. This makes possible to achieve comparable model performance to that of supervised learning with lesser labeling effort and resources. Active learning is well-suited to the situations where unlabeled data is abundantly available. Hierarchical classification of tweets complemented by active learning as a viable labeling mechanism presents an interesting research problem. We implemented the prevailing four hierarchical classification approaches with active learning for twitter domain. Based on the results, we can safely say that active learning is equally beneficial in Twitter. Comparing the results of the four approaches, hierarchical prediction through flat classification with active learning approach outperforms the other approaches.

Benzer Tezler

  1. Ergenlerde (13-18 yaş) cinsel istismar sonrası immün sistem değişikliklerinin değerlendirilmesi

    The evaluation of the immüne system changes after sexual abuse in adolescents(13-18 year old)

    HAMZA AYAYDIN

    Tıpta Uzmanlık

    Türkçe

    Türkçe

    2012

    Allerji ve İmmünolojiİstanbul Üniversitesi

    Çocuk Ruh Sağlığı ve Hastalıkları Ana Bilim Dalı

    DOÇ. DR. OSMAN ABALI

  2. Genç bayan ve erkeklerde göz çevresi antropometrik ölçümlerinin karşılaştırılmalı olarak incelenmesi

    A comparative study of measurements of the soft orbits in young women and men

    MELTEM AÇAR GÜDEK

    Yüksek Lisans

    Türkçe

    Türkçe

    2014

    AnatomiOndokuz Mayıs Üniversitesi

    Anatomi Ana Bilim Dalı

    PROF. DR. AHMET UZUN

  3. Fuzûlî'nin Sıhhat u Maraz'ı ile Derviş Siyahî'nin Mecma'-ı Tıbb'ında Ahlât-ı Erbaanın İşlenişi

    Discussing of Ahlat-ı Erbaa at Fuzuli's Sıhhat u Maraz an Derviş Siyahi's Mecma-ı Tıbb

    ÖMER GÖK

    Yüksek Lisans

    Türkçe

    Türkçe

    2013

    Deontoloji ve Tıp TarihiKırıkkale Üniversitesi

    Türk Dili ve Edebiyatı Ana Bilim Dalı

    PROF. DR. MUHİTTİN ELİAÇIK

  4. Serebral palsi'li çocuklarda su içi egzersizlerin spastisite ve motor fonksiyonlar üzerine etkisi

    EFFECTİVENESS OF AQUATİC EXERCİSES ON SPASTİCİTY AND MOTOR FUNCTİONS OF CHİLDREN WİTH CEREBRAL PALSY

    SEVDA ADAR

    Tıpta Uzmanlık

    Türkçe

    Türkçe

    2013

    Fiziksel Tıp ve RehabilitasyonAfyon Kocatepe Üniversitesi

    Fiziksel Tıp ve Rehabilitasyon Ana Bilim Dalı

    DOÇ. DR. ÜMİT DÜNDAR

  5. Aktif gürültü giderimi algoritmalarının analizi, gerçekleştirilmesi ve karşılaştırılması

    Analysis, implementation and comparison of active noise cancellation algorithms

    SÜLEYMAN KEREM GÖKALP

    Yüksek Lisans

    Türkçe

    Türkçe

    2013

    Elektrik ve Elektronik MühendisliğiAnkara Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    DOÇ. DR. MURAT EFE